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Vorwort 



In diesem Buch sollen Methoden der klassischen Statistik dargestellt werden. 
Die zu behandelnden Problemstellungen sind durch folgende Eigenschaften 
gekennzeichnet: 

• In einer gegebenen, klar abgegrenzten, großen Gesamtheit interessiert 
man sich für bestimmte Eigenschaften der Elemente dieser Gesamtheit. 
Möglicherweise erlauben Vorinformationen oder theoretische Herleitun- 
gen die Formulierung bestimmter Hypothesen über die Verteilung der 
Eigenschaftsausprägungen in der Gesamtheit. 

• Zur Untersuchung der Eigenschaften bzw. zur Überprüfung der Hypothe- 
sen wird ein Teil der Elemente der Gesamtheit zufällig ausgewählt und 
analysiert. Die Zahl der auszuwählenden Elemente ist aus Kostengründen 
auf einen Teil der Gesamtheit, die Stichprobe, begrenzt und fest vorgege- 
ben. 

• Einfache Methoden der beschreibenden (deskriptiven) Statistik werden 
zur Charakterisierung der in der Stichprobe enthaltenen exakten Werte 
herangezogen. 

• Mittels eines stochastischen (wahrscheinlichkeitstheoretischen) Modells, 
das sowohl die Art des Auswahlprozesses als auch die vorhandenen In- 
formationen und Hypothesen über die Gesamtheit berücksichtigt, werden 
Rückschlüsse von der Stichprobe auf die eigentlich interessierende Ge- 
samtheit gezogen. 

• Die Auswahl der Methoden des Rückschlusses von der Stichprobe auf die 
Gesamtheit mittels wahrscheinlichkeitstheoretischer Hilfsmittel, die man 
als induktive oder Inferenzmethoden bezeichnet, werden mit Hilfe ent- 
scheidungstheoretischer Konzepte aus der Wahlhandlungstheorie gesteu- 
ert und beurteilt. 

Bei der Auswahl des Stoffes haben wir uns auf die grundlegenden Konzepte 
der oben angesprochenen statistischen Teilgebiete Deskriptive Statistik (Ka- 
pitel 1), Wahrscheinlichkeitstheorie (Kapitel 2), Inferenzmethoden (Kapitel 3 
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und 4) sowie Statistische Entscheidungstheorie (Kapitel 5) beschränkt. Ent- 
wickelt wird so ein Referenzmodell für praktische empirische Arbeit. Jeder 
Abschnitt jedes Kapitels gliedert sich in einen Kerntext, den Aufgabenteil 
und „Ergänzungen und Bemerkungen“. Die dargebotenen Methoden sollen 
den Leser befähigen, sich auch weitere statistische Teilgebiete in selbständi- 
gem Studium zu erarbeiten. Dazu ist eine aktive Auseinandersetzung mit den 
Aufgaben unumgänglich. Hier finden sich auch zahlreiche Hinweise auf ge- 
samtwirtschaftliche und gesellschaftliche Rahmendaten sowie Datenquellen. 
Zum Weiterlesen finden sich vielfältige Anregungen in den „Ergänzungen und 
Bemerkungen“, die jeden Abschnitt abschließen. 

Dieses Buch — „Statistische Methoden“ — ist 1981 in erster Auflage er- 
schienen. Mitgearbeitet hatten damals M. Kraft und K. Braun. Von M. Kraft 
und Th. Landes wurde nun diese neue, vollständig überarbeitete, erweiterte 
und aktualisierte Auflage erstellt. Die in zahlreichen Lehrveranstaltungen 
bewährte Grundkonzeption eines die Vorlesung begleitenden Arbeits- und 
Übungsbuches wurde beibehalten. Hinweise auf Fehler und Anregungen zur 
Neugestaltung haben wir von Kollegen und Studenten erhalten. Besonde- 
rer Dank gilt A. Burger, H. Epstein, M. Greitenevert, P. Harff, H.-P. Lüüs, 
H. J. Skala, F. Stege und U. Walwei. Verbliebene oder neu hinzugekommene 
Fehler gehen zu unseren Lasten. 

Paderborn, im Januar 1992 Manfred Kraft 

Thomas Landes 
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Kapitel 1 

Einführung und 
Grundbegriffe der 
deskriptiven Statistik 



1.1 Statistische Fragestellungen 

Eine einfache und dennoch exakte und umfassende Definition des Begriffs 
„Statistik“ zu geben, ist nicht leicht - insbesondere nicht zu Beginn eines 
entsprechenden Arbeitsbuches. Wir versuchen, uns diesem Ziel dadurch zu 
nähern, daß wir zunächst einige Fragestellungen, mit denen sich die Statistik 
bzw. der Statistiker beschäftigt, kennenlernen wollen: 

• Wie lassen sich gesellschaftliche Zustände und Prozesse durch empirische 
Beobachtungen erfassen? 

• Wie können quantitative empirische Informationen (Daten) über wirt- 
schaftliche oder sozioökonomische sowie gesellschaftliche Phänomene be- 
schafft werden? 

Diese Fragen beziehen sich auf die exakte Formulierung der einer empirischen 
Untersuchung zugrundeliegenden Fragestellung sowie deren Operationalisie- 
rung. Insbesondere ist hier zu klären, welche empirischen Größen den in der 
jeweiligen Fachwissenschaft oder in der Praxis benutzten theoretischen Be- 
griffen entsprechen bzw. entsprechen könnten. Neben diesen Fragen der Da- 
tenabgrenzung spielen in diesem Zusammenhang Fragen der Datenbeschaffung 
eine wichtige Rolle. In der sozialwissenschaftlichen Forschung beschäftigt 
man sich insbesondere im Rahmen der Wirtschafts- und Sozialstatistik mit 
diesen Problemen. 

• Wie lassen sich vorliegende statistische Daten gliedern, übersichtlich dar- 
stellen und die in ihnen enthaltenen Informationen möglichst prägnant 
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zusammenfassen? 

• Wie erkennt man wichtige Strukturen von Datenmengen (z.B. relevante 
Zusammenhänge zwischen verschiedenen Größen) und wie lassen sich 
diese quantitativ exakt erfassen und interpretieren? 

Das hier angesprochene Erkenntnisziel der Datenbeschreibung und Daten- 
analyse ist Gegenstand der deskriptiven (beschreibenden) Statistik. Sie stellt 
Methoden zur Beschreibung und zur ersten (explorativen) Analyse von Da- 
tenmengen zur Verfügung. Man bedient sich dabei in immer stärkeren Maße 
(angesichts der Fülle des zu verarbeitenden Datenmaterials) in konkreten 
statistischen Untersuchungen der Hilfe des Computers und statistischer Soft- 
warepakete. 

• Welche Schlüsse lassen sich aus der Analyse von Teilmengen und den dar- 
aus gewonnenen Informationen auf die zugehörige Gesamtmenge ziehen? 

• Welche Aussagen aus der Analyse empirischer Beobachtungen lassen sich 
verallgemeinern? 

Statistische Fragen dieser Art bezeichnet man als Inferenzprobleme oder Fra- 
gen des statistischen Schließens. Die Erarbeitung und Diskussion der wich- 
tigsten im Rahmen der induktiven ( schließenden ) Statistik entwickelten Me- 
thoden steht im Mittelpunkt dieses Arbeitsbuches. 

• Wie lassen sich Informationen zur Entscheidungsfindung und zur Modell- 
auswahl verwenden? 

• Wie lassen sich „statistische Modelle“ des Gesellschaftsgeschehens oder 
eines Teilbereichs desselben konstruieren, die die komplexen, nicht immer 
exakt erfaßbaren Zusammenhänge und Prozeßabläufe zumindest in den 
wesentlichen Zügen korrekt wiedergeben? 

Mit den beiden letzten Fragestellungen, die sich auf entscheidungstheoretische 
bzw. statistische Modelle beziehen, beschäftigen sich hauptsächlich Entschei- 
dungstheorie und Ökonometrie : Disziplinen, die auf wahrscheinlichkeitstheo- 
retische Methoden zurückgreifen. Die statistische Entscheidungstheorie, die 
sich mit speziellen — im Zusammenhang mit statistischen Fragestellungen 
auftretenden — entscheidungstheoretischen Modellen befaßt, erlaubt darüber 
hinaus tiefere Einblicke in Inferenzprobleme und die Einordnung induktiver 
Methoden in einen größeren Zusammenhang. 

Eine konkrete empirische Untersuchung mit Hilfe statistischer Modelle 
umfaßt also die folgenden Arbeitsschritte: 

• Formulierung des Untersuchungszieles, 

• Planung und Durchführung der Datensammlung (Datenerhebung), 

• Erfassung, Codierung und Beschreibung des Datenmaterials, 
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• Analyse, Interpretation und Auswertung im Hinblick auf das Untersu- 
chungsziel, 

• Verallgemeinerungen der gefundenen Befunde — soweit möglich — unter 
Angabe möglicher Fehler und deren Größenordnung, 

• Präsentation. 



Aufgabe 1.1/1 In welchem Sinne wird der Begriff „Statistik“ verwendet? 



Aufgabe 1.1/2 Diskutieren Sie folgende Aussagen: 

• Statistik ist ein allgemeiner Werkzeugkasten zur Beschreibung und Ana- 
lyse von Daten. . . 

• Statistics . . .is divided into three parts: collecting data, organizing and 
summarizing data, and drawing conclusions from data. 

• There are three kinds of lies: lies, damned lies, and statistics. 

• Statistik ist eine Zusammenfassung von Methoden, welche uns erlauben, 
vernünftige Entscheidungen im Falle von Ungewißheit zu fällen. 

Ergänzungen und Bemerkungen 

• Ausführungen zum Begriff und den Aufgaben der Statistik (des Stati- 
stikers) finden sich in nahezu allen Lehrbüchern und in einer Reihe von 
Aufsätzen wie z.B. Kendall (1958) oder Vogel (1980). Speziell über die 
Aufgaben der amtlichen Statistik informieren Schriften des Statistischen 
Bundesamtes, z.B. (1988), sowie Nowak (1980). 

• Einführungen in die Wirtschafts- und Sozialstatistik finden sich bei Zwer 
(1985) oder von der Lippe (1990). Informationen aus erster Hand zur 
Explorativen Datenanalyse erhält man bei Tukey (1977). Klassische Me- 
thoden der deskriptiven Statistik finden sich ausführlich dargestellt in 
Menges/Skala (1973) oder Ferschl (1980). Einen Überblick über statisti- 
sche Software vermitteln Woodward u.a. (1987), sowie die Besprechun- 
gen aktueller Soft wäre Versionen in Fachzeitschriften wie „Chance“ oder 
„Journal of Applied Econometrics“. Stellvertretend für die zunehmende 
Literatur zum Thema „Statistik und PC“ seien Afflerbach (1987), Böker 
(1989), Bosch (1986), Krotz (1991), Matiaske (1990) und Voß (1988) ge- 
nannt. 

• Eine kurze Darstellung der Geschichte der Statistik findet sich bei Weich- 
selberger (1973). 

• Krämer (1991), Lachs/Nesvada (1986), Huff (1978) oder Reichmann 
(1978) bieten reichlich Anschauungsmaterial zur dritten Aussage in Auf- 
gabe 1.1/2. 




4 



1.2 Grundbegriffe statistischer Erhebungen 

Grundlage des statistischen Schließens ist die Kenntnis empirischer Daten. 
Statistische Daten lassen sich durch eigene Erhebungen (Beobachten, Befra- 
gen, Experimentieren) oder durch Rückgriff auf bereits gesammelte Daten 
gewinnen. Im ersten Fall spricht man von einer Primär-, im zweiten Fall von 
einer Sekundärerhebung. Als Datenquellen für eine Sekundärerhebung bieten 
sich insbesondere die Veröffentlichungen der amtlichen Statistik (Statisti- 
sches Bundesamt, Statistische Landesämter, kommunale Statistische Ämter, 
Ministerien und ihnen nachgeordnete Behörden, Bundesbank) an. Hinzuwei- 
sen ist dabei vor allem auf das Statistische Jahrbuch, den Datenreport und 
die Fachserien des Statistischen Bundesamtes, die tief gegliedertes Daten- 
material über wirtschaftliche Rahmendaten enthalten. Zur nichtamtlichen 
Statistik zählen Wirtschaftsforschungsinstitute (wie IFO/München, Institut 
der deutschen Wirtschaft/Köln), Meinungsforschungsinstitute (wie Allens- 
bach oder Emnid/Bielefeld), Verbände, Gewerkschaften sowie Universitäts- 
institute (wie das Zentralarchiv für empirische Sozialforschung/Köln oder das 
Zentrum für Umfragen, Methoden und Analysen (ZUMA)/Mannheim). 

Gegenstand einer statistischen Untersuchung sind die sogenannten sta- 
tistischen Einheiten (z.B. Personen, Haushalte, Staaten usw.). Bestimmte, 
genau festgelegte Merkmale (Variablen, Items) dieser statistischen Einheiten 
sollen erfaßt (erhoben), beschrieben und analysiert werden. Konkrete Merk- 
malsausprägungen können sowohl quantitativer (verfügbares Einkommen ei- 
nes Haushalts, Bruttosozialprodukt europäischer Staaten usw.) als auch qua- 
litativer (Berufsgruppenzugehörigkeit einer Person usw.) Art sein. Im letz- 
ten Fall spricht man von qualitativen Merkmalen. Bei den quantitativen 
Merkmalen unterscheidet man üblicherweise quantitativ-diskrete Merkmale 
(es gibt nur endlich viele oder abzählbar unendlich viele Merkmalsausprä- 
gungen) von stetigen Merkmalen (es gibt überabzählbar viele Merkmalsaus- 
prägungen). Häufig werden zur weiteren Analyse diskrete Merkmale mit sehr 
vielen Merkmalsausprägungen wie stetige Merkmale behandelt (man spricht 
dann von quasi-stetigen Merkmalen) oder stetige Merkmale durch Klassen- 
bildung in diskrete Merkmale (mit den Klassen als Ausprägungen) überführt. 

Bezüglich der Skalierung der Merkmalsausprägungen unterscheidet man 
nominalskalierte, ordinalskalierte und kardinalskalierte Daten. 

♦ Bei nominalskalierten Merkmalen lassen sich Merkmalsausprägungen le- 
diglich durch unterschiedliche Namen unterscheiden (z.B. Geschlecht). 

• Bei ordinalskalierten Merkmalen lassen sich die Merkmalsausprägungen 
in natürlicher Weise ordnen (z.B. Zensur). 

# Bei kardinalskalierten Merkmalen lassen sich auch die Abstände zwischen 
Merkmalsausprägungen bestimmen (z.B. Einkommen gemessen in DM). 

Statistische Einheiten bezeichnet man auch als Merkmalsträger. Die sowohl 
in sachlicher, räumlicher und zeitlicher Hinsicht exakt abgegrenzte Gesamt- 
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heit aller für eine spezifische statistische Untersuchung in Frage kommen- 
den Merkmalsträger heißt Grundgesamtheit (statistische Masse, Population). 
Grundgesamtheiten können konkrete endliche oder unendliche Mengen sein, 
deren Elemente sich auflisten oder mittels Bedingungen definieren lassen (z. 
B. alle Beamten einer bestimmten Arbeitsstätte des öffentlichen Dienstes zum 
31. 12. 91), oder aber gedacht, hypothetisch sein (z. B. alle Würfe mit einem 
idealen Würfel). Ist die Grundgesamtheit endlich, so bezeichne N die Anzahl 
ihrer Elemente. Soll einer statistischen Untersuchung die gesamte Grundge- 
samtheit zugrundegelegt werden, sind also alle relevanten Merkmalsträger zu 
erfassen, so spricht man von einer Vollerhebung. Ist die Grundgesamtheit 
jedoch sehr groß und/oder die Meßtechnik sehr kostspielig, wird man aus 
ökonomischen oder Datenschutz-Gründen nicht alle statistischen Einheiten 
der Grundgesamtheit in die statistische Untersuchung einbeziehen. (Oft ist 
eine Vollerhebung auch praktisch nicht durchführbar.) Man spricht dann von 
einer Teilerhebung , das Ergebnis einer Teilerhebung ist eine Stichprobe vom 
Umfang n. Um systematische Fehler beim Schließen von Stichprobeninforma- 
tionen auf die Grundgesamtheit zu vermeiden, benutzt man die sogenannte 
Zufallsauswahl: die statistischen Einheiten der Stichprobe werden mit Hilfe 
eines Zufallsmechanismus aus der Grundgesamtheit ausgewählt. Dies wird 
in Abschnitt 3.1 präzisiert werden. 

Aufgabe 1.2/1 Bei konkreten empirischen Forschungsprojekten stellen oft 
sowohl die exakte Abgrenzung der Grundgesamtheit als auch die genaue Fest- 
legung des zu erhebenden Merkmals und die Durchführung einer Zufallsaus- 
wahl schwierige Probleme dar. Versuchen Sie dies an folgenden „Projektti- 
teln“ deutlich zu machen: 

• Einkommenssituation in den Entwicklungsländern 

• Arbeitslosigkeit in Industriestaaten 

• Lebensstandard in Deutschland 

• Aufstiegs verhalten von Bediensteten in öffentlichen Dienststellen 

• Intelligenz von Arbeiterkindern in der Bundesrepublik Deutschland. 



Aufgabe 1.2/2 

a) Welche Arten von Merkmalsausprägungen lassen sich unterscheiden (Bei- 
spiele) und wie lassen sich diese erfassen (messen)? 

b) Sind Vollerhebungen auf jeden Fall Teilerhebungen vorzuziehen? 

c) Beschreiben Sie näher, welche Arten von Fehlern beim Schließen von 
Stichprobeninformationen auf die Grundgesamtheit auftreten können. 

d) Welche anderen Auswahlprinzipien als das Zufallsauswahlverfahren sind 
denkbar? 




Ergänzungen und Bemerkungen 

• Eine Darstellung aktueller Probleme der amtlichen Statistik findet der 
Leser in Heft 1, 1989, des Allgemeinen Statistischen Archivs, dem Organ 
der Deutschen Statistischen Gesellschaft. 

• Fragen der Meßbarkeit von Daten werden in systematischer Weise im Rah- 
men der Meßtheorie behandelt. Eine umfassende Darstellung meßtheore- 
tischer Konzepte findet man bei Pfanzagl (1971). Eine Einführung in die 
Problematik der Meßgenauigkeit anhand konkreter praktischer Problem- 
stellungen bieten auch die Beiträge im Allgemeinen Statistischen Archiv 
1,1985. 

• Auswahlverfahren sind besonders intensiv im Bereich der empirischen 
Sozialforschung von Soziologen, Pädagogen, Psychologen und Politolo- 
gen diskutiert worden (vgl. z.B. Böltken (1976) oder Scheuch (1974)). 
Stellungnahmen zu methodischen Fragen der Auswahlverfahren finden 
sich auch in zahlreichen Veröffentlichungen des Statistischen Bundesam- 
tes (vgl. die monatlich erscheinende Zeitschrift “Wirtschaft und Stati- 
stik“) sowie von Meinungs- und Wirtschaftsforschungsinstituten (vgl. de- 
ren meist regelmäßig erscheinenden Publikationen). Ein Standardwerk für 
den deutschsprachigen Raum ist Stenger (1986). Eine leicht lesbare Ein- 
führung in Stichprobenverfahren bieten auch Schwarz (1975) sowie Henry 
(1990). 

1.3 Methoden zur Beschreibung univariater 
Datensätze 

Wird ein eindimensionales Merkmal X bei n statistischen Einheiten erhoben, 
so ist das Ergebnis der Erhebung ein Vektor (a?i, . . .,x n ) von n Meßwerten 
(Beobachtungen, Antworten). Wir haben dabei — und das wollen wir auch 
im folgenden tun — unterstellt, daß es sich um ein nicht-häufbares Merkmal 
handelt, d.h. für jede statistische Einheit ist eine und nur eine Merkmalsaus- 
prägung möglich. Das Protokoll der Erhebung, das diese n Meßwerte enthält, 
bezeichnet man als Urliste , den Wertevektor selbst als univariaten Datensatz. 

Nun wird in konkreten empirischen Untersuchungen in der Regel mehr 
als ein Merkmal erhoben. Der Fragebogen für die Personen bei der Volks- 
zählung 1987 enthielt 18 teilweise mehrteilige Fragen und erfaßte somit mehr 
als 18 Merkmale. Man spricht dann von einem multivariaten Datensatz. 
Dennoch ist die Auswertung der Einzelmerkmale für sich, also die Analyse der 
mehr als 18 univariaten Datensätze, hier ebenfalls von Interesse. Methoden 
zur Beschreibung solcher univariater Datensätze werden wir deshalb zunächst 
kennenlernen. 

Der Statistiker benutzt dazu Tabellen, Graphiken und Maßzahlen, bzw. 
Kenngrößen. Nicht verschweigen sollte man dabei, daß in einer konkreten 
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empirischen Untersuchung die eigentliche statistische Analyse eine Reihe von 
sehr zeitaufwendigen Vorarbeiten voraussetzt. Die in der Urliste enthalte- 
nen Daten sind zunächst maschinenlesbar aufzubereiten, d.h. zu kodieren, 
geeignet anzuordnen und sorgfältig und ausreichend zu dokumentieren; dann 
erfolgt die Dateneingabe (das Einlesen der Rohdaten), möglicherweise Trans- 
formationen einzelner Variablen und die Fehlerkontrolle (vgl. hierzu Chatfield 
(1985)). 

1.3.1 Tabellendarstellung 

a) Ist X ein qualitatives Merkmal und sind Ai, . . ., A* die k verschiedenen 
Ausprägungen des Merkmals X , so bezeichnen wir mit n(A,) = n,- die 
absolute Häufigkeit (Anzahl) der statistischen Einheiten mit Ausprägung 
Ai (1 = 1,..., k). Mit 

hi = h(Ai) = — 

n 

bezeichnet man die relative Häufigkeit (Anteil) der statistischen Einheiten 
mit Ausprägung A,-. Die Gesamtheit der n,* bzw. ft, bezeichnet man als 
die eindimensionale (empirische) Häufigkeitsverteilung des qualitativen 
Merkmals X. 

Für das Merkmal X =„ Stellung im Beruf eines Erwerbstätigen der BR 
Deutschland 1987“ werden vom Statistischen Bundesamt folgende Ausprä- 
gungen betrachtet: 

A\ „Selbständige“ 

Ai „Mithelfende Familienangehörige“ 

A 3 „Beamte“ 

A 4 „Angestellte“ 

A 5 „Arbeiter“. 

Folgende Häufigkeitstabelle ergibt sich (in Tausend): 





Ui 


hi 


Ai 


2426 


0.10 


M 


838 


0.03 


A 3 


2420 


0.09 


A 4 


10203 


0.39 


A 5 


10084 


0.39 




25971 


1.00 



Es gilt offensichtlich: 

k k 

0 < n, < n; = n; 0 < ft, < 1; ^ft, = 1. 

*=1 »=1 
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b) Sei nun X ein quantitativ diskretes Merkmal mit endlich vielen verschie- 
denen Ausprägungen x \, . . . , #*. Der aufmerksame Leser wird feststellen, 
daß wir sowohl die Daten der Urliste als auch die verschiedenen Merk- 
malswerte beide mit demselben Symbol Xi bezeichnen. Zur Vermeidung 
von Verwechslungen sei hier vereinbart: Hat die Liste der x, die Länge n, 
so ist die Urliste gemeint und der Index i bezieht sich auf die zugehörige 
statistische Einheit, hat sie die Länge Ar, so sind die verschiedenen Merk- 
malswerte gemeint. 

Wir definieren wieder jeweils für i — 1, . . . , k: 

• m = n{xi) = absolute Häufigkeit, 

• hi = h(xi) = = relative Häufigkeit. 

Ist X zumindest ordinalskaliert, so lassen sich die Ausprägungen in 
natürlicher Weise ordnen. Es ist dann sinnvoll, in der tabellierten Dar- 
stellung der Häufigkeitsverteilung die X{ der Größe nach zu ordnen und 
so umzunumerieren, daß x\ < . . . < x*. In diesem Falle lassen sich auch 
kumulierte Häufigkeiten bestimmen: 

• F(x) = <x hi = kumulierte relative Häufigkeit. 

Die Funktion F heißt (empirische) Verteilungsfunktion von X. Sie de- 
finiert für jede reelle Zahl x (nicht nur für die X{) die kumulierte rela- 
tive Häufigkeit der Merkmalsausprägungen < x. Sie ist eine monoton 
nicht-fallende Funktion. Offenbar reicht die Kenntnis einer der drei Ge- 
samtheiten n, , hi , Fi = F(xi) (i = 1, . . . , k) aus, um die jeweils anderen 
beiden zu rekonstruieren. In der Tabellenform werden üblicherweise alle 
drei Gesamtheiten angegeben. 

Ergibt z.B. die Erhebung in einem Wohngebäude mit 10 Wohneinheiten 
folgende Kinder zahlen in den einzelnen Wohnungen (Reihenfolge gemäß 
Urliste): 

0, 2, 0, 1, 4, 3, 1, 5, 1, 3 
so erhält man folgende Tabelle: 



Xi 


ni 


hi 


Fi 


0 


2 


0.2 


0.2 


1 


3 


0.3 


0.5 


2 


1 


0.1 


0.6 


3 


2 


0.2 


0.8 


4 


1 


0.1 


0.9 


5 


1 


0.1 


1.0 




10 


1.0 





c) Ist X ein quantitativ-stetiges oder quasi-stetiges Merkmal, und ist so- 
wohl der Erhebungsumfang als auch die Meßgenauigkeit sehr groß, so ist 
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vor der Tabellendarstellung der Häufigkeitsverteilung eine Klassenbildung 
( Grupp ierun g) vor z unehmen . 

Dazu teilt man das Intervall, in dem alle Merkmalsausprägungen lie- 
gen, in Teilintervalle 7 t * mit Intervallgrenzen xf (Untergrenze) und xf 
(Obergrenze) (i = 1 , . . . , Ar) , die sogenannten Klassen , auf und ermit- 
telt die absoluten Häufigkeiten n* = n(/,-) nun nicht mehr für jede ein- 
zelne Merkmalsausprägung, sondern für jede Klasse (Klassenbesetzungs- 
zahlen). Entsprechend läßt sich für die Klassen die relative Häufigkeits- 
verteilung der hi = /*(/,) und die kumulierte Häufigkeitsverteilung der 
F{ = F(Xi) — Yl)=i hj ermitteln. Dabei werden die relativen Häufigkei- 
ten oft der Klassenmitte x * , die kumulierten Häufigkeiten den jeweiligen 
Klassenendpunkten x° zugeordnet. 

Bei der Festlegung der Klassengrenzen ist darauf hinzu weisen, daß: 

• jede beobachtete Merkmalsausprägung in eine und nur eine Klasse 
fällt, 

• hinsichtlich der zu untersuchenden Fragestellung möglichst homogene 
Klassen gebildet werden, 

• die Klassenbreiien A Xi = x° — xf (i = 1, . . . , k) nicht notwendigerweise 
gleich sein müssen (oft werden offene Randklassen x < xf (d.h. x “ = 
— oo) bzw. x > x k (d.h. x° k — oo) benutzt), 

• die Beobachtungen bei der Benutzung von Sekundärstatistiken oft 
nur in gruppierter Form vorliegen und die vorgegebenen Klassengren- 
zen dann nur übernommen oder benachbarte Klassen zusammengefaßt 
werden können. 

Beispielsweise enthält der Datenreport 1989 des Statistischen Bundesam- 
tes Eckdaten zur Bevölkerungsstruktur der BR Deutschland am 25. Mai 
1987 gruppiert nach Altersklassen (in Tausend), woraus sich folgende Ta- 
bellendarstellung der entsprechenden Häufigkeiten ergibt: 



i 


Alter in Jahren 


ni 


hi 


Fi 


i 


x< 14 


8903 


BEB 


0.146 


2 


15 <x< 39 


23149 


E£S| 


0.525 


3 


40 <x< 64 


19677 




0.847 


4 


65 <x 


9348 




1.000 






61077 


1.000 





1-3,2 Graphische Darstellung 

a) Zeitschriften und Zeitungen benutzen zur Veranschaulichung statistischer 
Zahlen gerne sogenannte Piktogramme. So werden unterschiedliche Ein- 
kommen in verschiedenen Ländern durch entsprechend unterschiedlich 
hohe Münzstapel oder unterschiedliche Schiffstonnagen durch verschieden 
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große Schiffe dargestellt. Dabei wird aber bereits ein Problem deutlich: 
Flächen, Höhen oder Volumina werden unterschiedlich wahrgenommen. 
Krämer (1989), Kapitel 9, zeigt Beispiele für solche „frisierte“ Pikto- 
gramme, die zu falschen Schlüssen verleiten können (sollen?). 

b) Für die Darstellung der relativen Häufigkeiten eines qualitativen Merk- 
mals eignet sich das Kreisdiagramm (Kuchendiagramm). Dabei wer- 
den die relativen Häufigkeiten durch entsprechend große Kreissektoren 
repräsentiert. Für das Beispiel „Stellung im Beruf 4 ergibt sich Abbildung 
1 . 1 . 




Abbildung 1.1: Kreisdiagramm 



c) Zur Veranschaulichung der (absoluten, relativen oder kumulierten) Häu- 
figkeitsverteilung eines quantitativen Merkmals X bieten sich folgende 
graphische Darstellungen an. Trägt man auf der Abszisse eines Koor- 
dinatensystems die verschiedenen Merkmalsausprägungen x, und auf der 
Ordinate die Häufigkeiten ab, so erhält man im Falle ungruppierter Daten 
für die absolute und relative Häufigkeitsverteilung je ein Stabdiagramm 
(siehe Abbildung 1.2), für die kumulierte Häufigkeitsverteilung eine mo- 
noton nicht-abnehmende Treppenfunktion (siehe Abbildung 1.3). Im Falle 
gruppierter Daten wählt man die Histogrammdarstellung: Man trägt über 
jeder Klasse /, eine Säule (Rechteck) ab, deren Höhe /, so gewählt wird, 
daß die Rechteckfläche der Säule gleich der relativen Häufigkeit der Klasse 
ist. Ist A x, die Klassenbreite der Klasse so erhält man für die Höhe 
der entsprechenden Säule also 

, - JlL. - Ui 

1 A Xi nAxi 
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-1 0 1 2 3 4 5 G 

Abbildung 1.2: Stabdiagramm 



Im Koordinatensystem trägt man dann auf der Ordinate diese sogenann- 
ten Dichten ab. Verbindet man die Mitten der oberen Rechteckseiten, 
so erhält man als weitere graphische Darstellung der Verteilung im grup- 
pierten Fall das sogenannte Häufigkeitspolygon (siehe Abbildung 1.4). Für 
die kumulierte Häufigkeitsverteilung erhält man einen Polygonzug , indem 
man die Verteilungsfunktion innerhalb der Klassen linear interpoliert; da- 
bei müssen offene Randklassen geeignet abgeschlossen werden. Der Poly- 
gonzug entsteht, indem man die Punkte 



(*?,0),(xf I F 1 ),... ) (x2_ 1) F t _ 1 ),(*J > l) 



im Koordinatensystem mit Geradensegmenten verbindet und vom letzten 
Punkt an nach rechts eine Horizontale in Höhe 1 zeichnet. Die Horizontale 
in Höhe 0 links vom ersten Punkt fällt mit der Abszisse zusammen (siehe 
Abbildung 1.5). 



d) Eine graphisch-tabellarische Darstellung stellen die von Tukey eingeführ- 
ten Stengel-und-Blätter Diagramme (stem-and-leaf display) dar (vgl. 
auch Hoaglin/Mosteller/Tukey (1982)). Hierzu teilt man die Beobach- 
tungswerte in Abhängigkeit von Meßgenauigkeit und Untersuchungszweck 
in Haupt- (Stengel) und Nebenwert (Blatt) auf, also z.B. 70.6 — ► 70|6 oder 
78430 — ► 78|430. So ergibt sich für die Lebenserwartung männlicher Neu- 
geborener in europäischen Ländern (Quelle: Statistisches Jahrbuch 1991 
für das Ausland) das folgende Schema: 
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F(X) 




Abbildung 1.3: Treppenfunktion 

63 4 Türkei 

64 2 SU 

65 

66 1 Ungarn 

67 1 4 6 Rum., Polen, CSFR 

68 3 5 Bulg., Jugosl. 

69 

70 0 6 7 7 9 ... , ehern. DDR,. . . 

71 6 8 

72 0 1 1 5 7 8 ..., ehern. BRD,... 

73 117 9 

74 1 2 5 Griech., Schweden, Island 

Analog zum Histogramm lassen sich aus dieser Darstellung eine Reihe von 
Informationen herleiten: 

• Es gibt drei recht homogene Ländergruppen hinsichtlich der Lebens- 
erwartung in Europa. 

• Die Lebenserwartung steigt tendenziell vom Südosten zum Nordwe- 
sten Europas an (Ausnahme Griechenland). 

1.3.3 Maßzahlen 

a) Maßzahlen der Lage (Lageparameter) sind Maßzahlen, die die Lage der 
Merkmalsausprägungen kennzeichnen sollen. Die wichtigsten Lagepara- 
meter sind das arithmetische Mittel x , der Median oder Zentralwert xz 
und der Modus oder Modalwert xm- 
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Abbildung 1.4: Histogramm und Häufigkeitspolygon 



Das für kardinalskalierte Merkmale definierte arithmetische Mittel 






*=i 



i = 1 



i = 1 



wird oft auch als durchschnittliche Merkmalsausprägung bezeichnet. Im 
gruppierten Fall, falls die einzelnen Merkmalsausprägungen in den Klas- 
sen nicht mehr bekannt sind, definiert man 



<1 K K 

i=i *=i 

Das arithmetische Mittel x hat folgende Eigenschaften: 

• x gibt den Wert an, den jede statistische Einheit aufweisen müßte, 
wenn bei gegebener Merkmalssumme jede statistische Einheit die glei- 
che Merkmalsausprägung hätte. 

• x fällt möglicherweise auf einen nicht beobachteten oder sogar nicht 
beobachtbaren Wert. 

• Transformationseigenschaft : Ist yi = a + bx{ (i = 1, . . . , n), dann gilt 
y = a -f bx. 

• Additivitäiseigenschaft: Sind a?i, . . . , x n und yi, . . . , y n zwei Meßreihen 
mit den jeweiligen arithmetischen Mitteln x und y, so hat die Meßreihe 

+ yi , • . . , x n -f y n das arithmetische Mittel x 4* y. 

• Schwerpunktseigenschaft: J3?=i( x * — = 0 . 
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Abbildung 1.5: Polygonzug 



• Optimalitätseigenschaft: min a 5^" =1 (a;,- — a ) 2 = ]Cr=i( x * “ x ) 2 - 

• x ist ausreißerempfindlich , d.h. große (kleine) einzelne Werte beein- 
flussen x stark; x ist nicht robust 

• Zerlegungssatz: Werden die ursprünglich ungruppierten Daten mit 
arithmetischem Mittel x in k Klassen mit jeweiligen Klassenmittel- 
werten X{ (arithmetisches Mittel der Daten in Klasse i ) und relativen 
Klassenhäufigkeiten h( gruppiert, so gilt 

k 

X = Xihi . 
i = 1 

Ein Merkmal, das genau zwei Ausprägungen annehmen kann, wird als 
dichoiom (binär, O-l-Variable, Dummy) bezeichnet. Kodiert man die bei- 
den Ausprägungen mit 0 bzw. 1, so gibt x den Anteil der Merkmalsträger 
mit Ausprägung 1 an und wird deshalb auch mit p bezeichnet. 

Der Median ist ein Spezialfall der sogenannten Fraktile : Ist p ein Anteils- 
wert, 0 < p < 1, so ist das p-Fraktil (oder (100p)%-Punkt) derjenige Wert 
£(p), für den gilt: 

F(x) < p für alle x < X( p ) und F{x) > p für alle x > x^ 

Für gruppierte Daten ist somit x ( p ) die Abszisse des Schnittpunkts einer 
Horizontalen in Höhe p mit dem Polygonzug, also (durch Interpolation): 

x (p ) = p 

r i — r i _ i 
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wobei i die Klassennummer mit F t _i < p < Fi ( Fo := 0) ist. Im ungrup- 
pierten Fall gibt es zwei Möglichkeiten (siehe Abbildung 1.6): 




Abbildung 1.6: Fraktile 



(i) Die Horizontale in Höhe p schneidet die Treppenfunktion an einer 
Senkrechten zwischen zwei Stufenhöhen an der Stelle x t , d.h. Fi_i < 
p < F{ (Fo := 0). Dann ist X( p ) = x,-. 

(ii) Die Horizontale in Höhe p ist genau in Höhe einer Stufe der Treppen- 
funktion über dem Intervall [x,-, x t +i), d.h. Fi = p. In diesem Fall 
erfüllt jeder Wert in diesem Intervall die Fraktildefinition; man wählt 
die Mitte X( p ) = ±(z,- + x,+i). 

Der Median ist gerade das 0.5-Fraktil, der 50%-Punkt. Im ungruppierten 
Fall kann der Median auch so ermittelt werden: die Merkmalsausprä- 
gungen in der Urliste werden der Größe nach geordnet (also zumindest 
Ordinalskalenniveau): X[ X ] < . . . < £[ n j. Dabei ist jede Merkmalsausprä- 
gung so oft aufgeführt, wie sie beobachtet wurde, und xp] bezeichnet den 
Merkmalswert an der i-ten Stelle der geordneten Reihe. Man definiert: 

x / *[(»+D/2] n ungerade 1 

l \ \ x [ntt] + a; [n/2+i]) n gerade / 

Der Median xz hat folgende Eigenschaften: 

• xz teilt die Meßreihe in zwei Hälften (50%-Punkt). 

• xz berücksichtigt lediglich die Rangordnung der Meßwerte, nicht den 
absoluten Wert. 
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• xz ist robuster als x . 

• Optimalitätseigenschaft : min <x ]jT)" =1 \ x i ~ a \ = X^=i \ x i ~ x z\- 

Weitere wichtige Fraktile sind die Quartile Q\ — £( 0 . 25 ) (1- Quartil), Q2 = 
xz (2. Quartil) und Q 3 = £( 0 . 75 ) (3. Quartil). 

Der Modus (Modalwert) xm schließlich ist definiert als der häufigste (im 
ungruppierten Fall) bzw. dichteste (im gruppierten Fall) Wert: xm = X { 0 
falls h(x{ 0 ) > h(xi) für alle i (ungruppiert) bzw. xm = £* 0 , falls /,- 0 > /,■ 
für alle i (gruppiert). Seine Ermittlung setzt lediglich Nominalskalenni- 
veau voraus, xm ist jedoch nur bei sogenannten eingipfligen ( unimodalen ) 
Verteilungen ( io ist eindeutig bestimmt) eine sinnvolle Maßzahl der Lage. 
Der Modus xm hat folgende Eigenschaften: 

• xm ist ausreißerunempfindlich. 

• min a 1 Xo (®* — a) = XlLi Xo(«i - ^m), wobei xo die charakteri- 
stische Funktion von 0 ist, d.h., Xo(0) = 1 und Xo(^) = 0 für x ^ 0. 

• Lokale Modalwerte (lokale Häufigkeits- bzw. Dichtemaxima) sind vom 
globalen Modalwert xm zu unterscheiden. 

Die Fechnersche Lageregel besagt: Ist eine Verteilung unimodal, so gilt 
(siehe auch die Abbildung 1.7): 




Abbildung 1.7: Rechtsschiefe, symmetrische, linksschiefe Verteilung 



xm < xz < x: rechtsschiefe Verteilung 

xm — xz = x: symmetrische Verteilung 

xm > xz > x: linksschiefe Verteilung 

b) Maßzahlen der Streuung ( Streuungsparameter ) sollen die relative Lage 
aller Merkmalsausprägungen zu den Lageparametern kennzeichnen. Je 
enger sich die Beobachtungswerte um einen Lageparameter gruppieren, 
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desto aussagekräftiger ist dieser. Das einfachste (aber ausreißerempfind- 
lichste) Streuungsmaß ist die Spannweite (ränge): 

fl — l x k — x i für ungruppierte Daten 
~ \ x£ — x\ für gruppierte Daten. 

Eine „gestutzte“ und robustere Maßzahl für die Streuung ist die Quar- 
tilsabweichung 



QA = i ((Q 3 - *z) + (x z - Qi)) = \(Qs - Qi) 

Die durchschnittliche absolute Abweichung (vom Median) d ist definiert 
als 

j 1 \ x i — x z\ni für ungruppierte Daten 1 

1 ~ J2i= i \ x i ~ x zWi für gruppierte Daten. J 

Mathematisch einfacher zu handhaben und durch verschiedene formale 
Eigenschaften ausgezeichnet ist die Varianz 

s 2 __ | ^ Yli=i( x i ~ x ) 2 ni für ungruppierte Daten 1 

\ n Yli=i( x i ~~ x ) 2n i für gruppierte Daten. J 

Es gilt nämlich: 

• Transformationseigenschaft : 

yi = a 4- bx{ (i = 1, . . . , n) ^ Sy = b 2 s 2 x . 

• Verschiebungssatz : s 2 = x 2 — x 2 ; dabei ist x 2 das arithmetische Mittel 
des Merkmals X 2 . 

• Streuungszerlegungssatz : Werden die ursprünglich ungruppierten Da- 
ten mit Varianz s 2 und arithmetischem Mittel x in k Klassen mit 
relativen Klassenhäufigkeiten hi sowie arithmetischen Mitteln x t und 
Varianzen s 2 der Daten der jeweiligen Klasse i, i = 1, . . . , fc, gruppiert, 
so gilt: 

« 2 = s L + s lxt = 53 + 53^*' _ 

t=i *=i 

Dabei bezeichnet man mit s 2 nt die Streuung innerhalb der Klassen 
(interne Varianz) und mit s 2 xt die Streuung zwischen den Klassen 
(externe Varianz). Eine Gruppierung in relativ homogene Klassen 
zeichnet sich dadurch aus, daß s? nt klein und s 2 xt groß relativ zu s 2 
sind. 

Ein aus der Varianz abgeleitetes Streuungsmaß ist die Standardabwei- 
chung s = -t-Vs 2 . Sie besitzt die gleiche Dimension wie die Meßwerte. 
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Einen maßstabsunabhängigen Streuungsparameter erhält man für Merk- 
male mit ausschließlich positiven Ausprägungen durch den Variations- 
koeffizienten VC = s/x , der gern zum Vergleich der Streuungen zweier 
unterschiedlich dimensionierter Meßreihen herangezogen wird. 

Ein Merkmal T heißt standardisiert, wenn i = 0 und Sj> = 1 gilt. Offen- 
sichtlich läßt sich jedes Merkmal X mit beliebigem arithmetischen Mittel 
x und beliebiger Varianz s 2 ^ 0 durch die Transformation T = (X — x)/s 
standardisieren. 

c) Arithmetisches Mitte l und Va rianz sind spezielle Momente , wobei das r- 

te Moment um c als (x — c) r = L — c) r definiert ist. Ist nämlich 

c = 0 und r = 1, so erhält man x , für c . = x (zentrales Moment) und 
r = 2 erhält man s 2 . Die höheren Momente charakterisieren die Form der 
Verteilung näher: Das 3. zentrale Moment (r = 3, c = x) ist z.B. ein Maß 
für die Schiefe der Verteilung. Es gilt nämlich: 

n ( < 0 linksschiefe Verteilung 

^ ( Xi — i-) 3 < = 0 symmetrische Verteilung 

i—i y > 0 rechtsschiefe Verteilung 

d) Die von Tukey (1977) vorgeschlagenen Kastenschaubilder (Box- und Whi- 
sker-Plots) geben einen instruktiven visuellen Eindruck von Streuung und 
Lage der Ausprägungen eines Merkmals. Dazu werden Extremwerte, Aus- 
reißer, Median und Quartile in ein Diagramm eingezeichnet. 



Aufgabe 1.3/1 

a) Welches Skalenniveau setzt die Erstellung der kumulierten Häufigkeits- 
verteilung voraus? 

b) Welche implizite Annahme liegt der Konstruktion der relativen Häufig- 
keitsverteilung sowie der kumulierten Häufigkeitsverteilung im Falle grup- 
pierter Daten zugrunde? 

c) Welche Informationen entnehmen Sie folgender Pressemitteilung: 

„Das Deutsche Institut für Wirtschaftsforschung (DIW), Berlin, hat be- 
rechnet, daß das im Durchschnitt verfügbare Einkommen je Familie von 
1728 DM je Monat 1970 bis 1979 auf 3401 DM geklettert ist. . . . Die mei- 
sten Familien gab es mit verfügbarem Monatseinkommen von 1900 DM, 
jede zweite Familie hatte ein Einkommen von weniger als 2700 DM . . . “ 
(Süddeutsche Zeitung vom 18.9.1980). Charakterisieren Sie die Verteilung 
hinsichtlich der Schiefe näher! 

d) „Absolut durchschnittlich zu bleiben, ist Wunsch und Stolz der Mitglie- 
der des in Kalifornien gegründeten Vereins langweiliger Leute. Sie haben 
es satt, um jeden Preis mit der Mode mitzuhalten, auf Parties mit dem 
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nicht vorhandenen Geist brillieren zu sollen und sich beständig als toller 
Typ verkaufen zu müssen. Ihre Sehnsucht ist es, sich im Garten ihres 
Häuschens mit Hund, Weib und Kind bei einer Dose Bier zu entspannen 
. . (Süddeutsche Zeitung vom 31.12.1980). 

Welche Fragen würden Sie als statistisch Vorgebildeter dem Vereinsvor- 
stand stellen? 



Aufgabe 1.3/2 „Frauen handeln gefühlsbetont, Männer rational“ — „Deut- 
sche verstehen zu organisieren, Italiener verstehen zu improvisieren“. Was 
haben diese Aussagen mit dem Streuungszerlegungssatz zu tun? 



Aufgabe 1.3/3 Eine Umfrage ergibt, daß von 100 Personen 20 Personen 
keine Urlaubsreise, 50 Personen genau eine Urlaubsreise, 10 Personen zwei 
Urlaubsreisen, 10 Personen 3 Urlaubsreisen und 10 Personen 4 Urlaubsreisen 
im Jahr 1980 unternommen haben. 

a) Erstellen Sie die Häufigkeitsverteilung für diese Stichprobe. 

b) Geben Sie eine graphische Darstellung der relativen sowie der kumulierten 
Häufigkeitsverteilung. 

c) Gruppieren Sie die Daten, indem Sie die Personen, die weniger als zwei 
Urlaubsreisen unternommen haben, zu einer Klasse zusammenfassen; eine 
zweite Klasse bilden die Personen, die mehr als eine, aber weniger als vier 
Urlaubsreisen unternahmen und schließlich eine letzte Gruppe die Perso- 
nen, die mehr als dreimal verreisten, aber weniger als sechsmal. Erstellen 
Sie für diese gruppierten Daten wieder die Häufigkeitstabelle und wählen 
Sie eine geeignete graphische Darstellung. 



Aufgabe 1.3/4 Bei einer Personenbefragung wurden folgende jährliche 

Ausgaben (in DM) für Reisen ermittelt: 

900, 2000, 1500, 1900, 2600, 5000, 1000, 2000, 1000, 3100. 

a) Ermitteln Sie arithmetisches Mittel, Median und Modus dieses Datensat- 
zes. 

b) Gruppieren Sie den Datensatz unter Verwendung folgender Klassengren- 
zen: bis 1000 DM; mehr als 1000 DM, aber höchstens 2000 DM; mehr 
als 2000 DM, aber höchstens 3500 DM; mehr als 3500 DM. Erstellen Sie 
für diese gruppierten Werte die absolute, relative und kumulierte Häufig- 
keitsverteilung. 

c) Ermitteln Sie aus den gruppierten Daten arithmetisches Mittel und Me- 
dian (die Klassenuntergrenze der ersten Klasse sei mit 0, die Klassenober- 
grenze der letzten Klasse mit 7500 festgelegt). 
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Aufgabe 1.3/5 

a) Welcher der drei Lageparameter — Modus, Median, arithmetisches Mittel 
— reagiert auf „Ausreißerwerte“ am empfindlichsten? 

b) Das statistische Amt einer Stadt gibt an, daß durchschnittlich 2.5 Perso- 
nen in einem Haushalt leben und 25% der Haushalte Einpersonenhaus- 
halte seien. Wieviele Personen leben in dieser Stadt durchschnittlich in 
einem Mehrpersonenhaushalt? 

c) Nehmen Sie begründet Stellung zu folgender Aussage: Die mittlere Abwei- 
chung - SLite-*) der Werte eines Merkmals von ihrem arithmetischen 
Mittel ist ein Maß für die Streuung dieser Werte. 

d) Für ein Merkmal wurden sowohl das arithmetische Mittel der Quadrate 
der Abweichungen der Merkmalswerte von ihrem Median als auch die Va- 
rianz ermittelt. Es ergaben sich hierfür die Zahlen 100 und 120. Welches 
ist der Wert für die Varianz? (Begründung!) 

e) Eine Maschine produziert quadratische Platten von durchschnittlicher 
Seitenlange lm und durchschnittlicher Fläche 1.5 m 2 . Berechnen Sie mit 
Hilfe des Verschiebungssatzes die Varianz der Seitenlange. 



Aufgabe 1.3/6 Gegeben seien folgende zwei Datensätze: 



Datensatz i 


n i 


Xi 




i 


100 


20 


16 


2 


200 


5 


4 



Bestimmen Sie arithmetisches Mittel und Varianz des Datensatzes, der aus 
allen statistischen Einheiten beider Datensätze besteht. 



Aufgabe 1.3/7 Die Verteilung der Lebensdauer X von 100 Haushalts- 
geräten sei durch folgende Tabelle gegeben: 



Lebensdauer in Jahren 


Häufigkeit 


0 < X < 2 


10 


2 < x < 4 


40 


4 < x < 5 


20 


5 < x < 7 


30 



Berechnen Sie die durchschnittliche Lebensdauer eines solchen Haushalts- 
gerätes sowie den Wert eines geeigneten Streuungsmaßes. 



Aufgabe 1.3/8 In 16 Heimspielen des 1. FC Kaiserslautern waren durch- 
schnittlich 20000 Zuschauer im Stadion am Betzenberg. 
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a) Wieviele Zuschauer müssen zum letzten noch ausstehenden Heimspiel 
kommen, damit der vom Vereins vorst and kalkulierte Zuschauerschnitt von 
21000 in dieser Saison erreicht wird? 

b) Folgende Übersicht über die Zuschauerzahlen wurde vom Vereinsvorstand 
der Presse übergeben: 



Zuschauerzahlen 


Zahl der Heimspiele 


0 - 10000 


4 


10000 - 20000 


8 


20000 - 40000 


4 



Erstellen Sie das zugehörige Histogramm. 

Aufgabe 1.3/9 In 6 Ställen stehen jeweils 10 Pferde. Das Merkmal 
Anzahl der Schimmel im Stall“ habe für die einzelnen Ställe folgende 
Ausprägungen: 



Stall i 


1 2 


3 4 


5 


6 


Xi 


3 4 


2 a 


3 


5 



Nennen Sie jeweils alle Werte von x$ = a, für die jeweils gilt: 

(i) 3 = Arithmetisches Mittel von X. 

(ii) 3 = Median von X. 

(iii) Die Verteilung von X ist unimodal mit Modus 3. 



Aufgabe 1.3/10 Laut Veröffentlichung des Statistischen Bundesamtes in 
der Fachserie 1, Reihe 4.2.1, Struktur der Arbeitnehmer, 30. 9. 1990, erschie- 
nen 6/1991, waren von den sozialversicherungspflichtig beschäftigten Arbeit- 
nehmern 13.4439 Millionen männlich und 9.4371 Millionen weiblich. 1.8377 
Millionen waren Ausländer. Nach der Stellung im Beruf sind 11.5482 Mil- 
lionen Arbeiter und 11.3328 Millionen Angestellte zu unterscheiden. 2.4269 
Millionen Personen gingen einer Teilzeitbeschäftigung nach, davon 0.4173 
Millionen unter 18 Stunden. 

a) Stellen Sie die Aufteilung der sozialversicherungspflichtig beschäftigten 
Arbeitnehmer nach dem Geschlecht, der Staatsangehörigkeit, der Stellung 
im Beruf und der Beschäftigungszeit jeweils graphisch dar. 

b) Wie groß ist der Anteil der Teilzeitbeschäftigten mit mehr als 18 Stunden 
Arbeitszeit unter allen bzw. unter den teilzeit beschäftigten sozialversiche- 
rungspflichtigen Arbeitnehmern? 
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Ergänzungen und Bemerkungen 

• Hinweise zur Literatur und zur Vorgehensweise in der explorativen Da- 
tenanalyse finden sich in Biehler (1982), Kraft (1984) und Rutsch (1986). 

• Die Tatsache, daß Einkommensverteilungen in der Regel rechtsschief sind, 
machen sich verschiedene Interessengruppen zunutze. So bevorzugen ge- 
werkschaftsnahe Kreise xm, industrienahe Kreise x als Durchschnitts- 
werte für Einkommen von Arbeitern bei Veröffentlichungen. 

• In der klassischen Statistik geht man davon aus, daß alle Meßwerte exakt 
und fehlerlos gemessen werden können. Robustheitsfragen spielen hier 
deshalb eine eher untergeordnete Rolle. In der Praxis kann dies jedoch 
anders aussehen (vgl. Hampel (1980) oder Huber (1981) zu robusten Me- 
thoden; eine erste Einführung findet sich auch in Hartung (1987), Kapitel 
XIV, 4). 

1.4 Methoden zur Beschreibung bivariater 
Datensätze 

In diesem Abschnitt wollen wir den Fall bivariater Datensätze betrachten; 
d.h. zwei Merkmale X bzw. Y sind bei jeder statistischen Einheit erhoben 
worden ( verbundene Erhebung). Die Urliste besteht aus n Beobachtungspaa- 
ren (xi,yi) (i = 1, . . . , n). Diese lassen sich durch (2 x n)-Matrizen (bivariater 
Datensatz) darstellen: 

*i yi 

%n Vn 

Sowohl X als auch Y können nominal-, ordinal- oder kardinalskalierte Merk- 
male sein. Da das niedrigere Skalierungsniveau die jeweils anwendbare Ana- 
lysemethode bestimmt, sind drei Techniken vorzustellen: 

• Kontingenzanalyse , falls eines der Merkmale nominalskaliert ist, 

• Rangkorrelationsanalyse , falls eines der Merkmale ordinal-, keines aber 
nominalskaliert ist, 

• Regressions - und Korrelationsanalyse , falls beide Merkmale kardinalska- 
liert sind. 

Dabei nimmt die Regressionsanalyse insofern eine Sonderstellung ein, als hier 
die beiden Variablen in eine abhängige und eine unabhängige Variable einge- 
teilt werden. 




23 



1.4.1 Nominalskalierte bivariate Merkmale 

a) Kontingenztabelle 

Die Merkmale A , Y seien also qualitativ oder quantitativ mit gruppier- 
ten Ausprägungen, so daß nur nominalskalierte Daten vorliegen. Zur 
Vereinfachung nehmen wir an, daß jeweils nur endlich viele Ausprägun- 
gen auftreten können. Mit Xi, . . . , x* bzw. yi, . . . , y\ bezeichnen wir die 
verschiedenen Ausprägungen von X bzw. Y . Es gelte kJ < oo aber nicht 
notwendigerweise k = /. Wir definieren dann: 

• mj = n(xi,yj), die Anzahl der statistischen Einheiten mit Ausprä- 
gungspaar (xi,yj) ( i = 1 = 1,...,/), sind die gemeinsamen 

absoluten Häufigkeiten des zweidimensionalen Merkmals (A, Y). 

• hij = = riij/n , der Anteil der statistischen Einheiten mit 

Ausprägung (x,-, yj (i = 1, . . . , k\ j = 1, . . . , /), sind die gemeinsamen 
relativen Häufigkeiten von (A, Y). 

. F(x,y) = h(X<x,Y<y) = E*,<rZ yj < y definiert die gemein - 
same (empirische) Verteilungsfunktion von (A, Y), falls beide Merk- 
male kardinalskaliert sind. Sie ist für jedes Paar (x,y) reeller Zahlen 
definiert. 

Jede der drei beschriebenen Gesamtheiten legt die gemeinsame Häufig- 
keitsverteilung von (A, Y) fest. Es gelten die folgenden Eigenschaften: 

0 < riij < n 

0 < hij,F(x,y) < 1. 

Eine übersichtliche Tabellendarstellung ergibt sich durch die Kontingenz- 
tabelle 





yi • 


• • Vj ■ 


• • yi 




Xi 


nn • 


• nij • 


• • rtu 


n\ 


Xi 


nn • 


• • riij • 


• • fiu 


fii. 


Xk 


nki * 


• • n k j • 


• • n k i 


n k . 




rc. l • 


• • n.j • 


• • n.i 


n 



bzw. durch das Einträgen der relativen Häufigkeiten anstelle der absoluten 
in die obige Tabelle. 

/ 

n i = Y n ‘j = 

;'=i 
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liefert für i = 1 die absolute Häufigkeit für X = Xi (ohne Rücksicht 

auf den Y-Wert), die Randverteilung von X. 

k 

n.j = ^riij = n{y j ) 

*= 1 

liefert für j = 1, . . . , / die absolute Häufigkeit für Y = yj (ohne Rücksicht 
auf den X-Wert), die Randverteilung von Y . Es gilt: 



Y n i = Y ni 

j-i t=i 



k / 






ij = n 



für nicht-häufbare Merkmale. 

Als Beispiel sei die Bevölkerung (in Tausend) der BR Deutschland zum 
25. 5. 1987 laut Volkszählung gegliedert nach Altersgruppen (X) und 
Geschlecht (Y) (Quelle: Statistisches Bundesamt) betrachtet. Als Kon- 
tingenztabelle erhält man für die absoluten Häufigkeiten 



x\y 


w 


m 


rii. 


unter 15 


4336 


4567 


8903 


15-39 


11320 


11829 


23144 


40-64 


9957 


9720 


19677 


über 64 


6142 


3206 


9348 


n.j 


31755 


29322 


61077 



und die relativen Häufigkeiten 





w m 


hi. 


unter 15 


0.071 0.075 


0.146 


15-39 


0.185 0.194 


0.379 


40-64 


0.163 0.159 


0.322 


über 64 


0.101 0.052 


0.153 


h.J 


0.520 0.480 


1.000 



Als graphische Darstellung dient für 



• die gemeinsamen relativen Häufigkeiten ein Stabdiagramm, 

• die gemeinsame Verteilungsfunktion eine Treppenfunktion 



über der x-y-Ebene. 



b) Bedingte Häufigkeiten 

Fragen wir nach dem Anteil der 40-64-jährigen Personen unter der weib- 
lichen Bevölkerung in der BR Deutschland zum 25. 5. 1987, so ergibt sich 
aufgrund obiger Angaben: 



h( 40 < X < 64 | Y = w) = 



9957 

31755 



0.163 

0.520 



0.314. 
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Solche Häufigkeiten, die sich auf eine Teilgesamtheit der ursprünglich er- 
hobenen statistischen Einheiten beziehen, nennt man bedingte Häufigkei- 
ten. Allgemein erhalten wir: 

h(X = Xi | Y = yj) = h{x{ \yj ) = ^ = 

rij tij 

die bedingte Häufigkeit von x, gegeben Y = yj , liefert für jedes yj ( j = 
1 ,...,/) eine bedingte (Häufigkeits-) Verteilung von X. Es gibt also / 
bedingte Verteilungen von X. Analog liefert 

h(Y = yj \ x = Xi) - h(yj\xi) = ^ 

die bedingte Häufigkeit von yj gegeben X = für jedes X{ {i — 1, . . . , fc) 
eine bedingte (Häufigkeits-) Verteilung von Y. Es gibt also fc bedingte 
Verteilungen von Y. 

Für unser Beispiel erhalten wir die folgenden bedingten Verteilungen: 



hi 


>i|«) 

w 


m 


h\ 

xV 


w 


m 




unter 15 


0.137 


0.156 


unter 15 


0.487 


0.513 


1 


15-39 


0.356 


0.403 


15-39 


0.489 


0.511 


1 


40-64 


0.314 


0.331 


40-64 


0.506 


0.494 


1 


über 64 


0.193 


0.110 


über 64 


0.657 


0.343 


1 




1.000 


1.000 





Offensichtlich gilt für alle i = 1 , . . . , k und j = 1 , . . . , 

K x i>yj) = Äy = 



c) Statistische Unabhängigkeit 

Zwei Merkmale heißen (statistisch) unabhängig , falls eine der folgenden 
äquivalenten Bedingungen erfüllt ist: 

• h(yj\x i) = /i(t/j|x 2 ) = * ‘ ‘ = h (yj\ x k) = %;) für alle i- 

• = /i(x t |t/ 2 ) = • • • = h(xi\yi) = h(xi) für alle i. 

• /*(£,•, %•) = AfaOMw) für alle ij. 

• F(x, y) = i r '(x) F(y) für alle x, y (bei kardinalskalierten Merkmalen). 

In unserem Beispiel sind X ) Y abhängige Merkmale. (Prüfen Sie dies 
anhand der obigen Kriterien nach!) 

Bezeichnet man mit n,j die absoluten Häufigkeiten, die bei vorgegebenen 
Randverteilungen n,-. und n. ; * bei Unabhängigkeit von X, Y gelten müßten, 
also 



n 




26 



so lassen sich Maße für die Stärke der Abhängigkeit wie folgt definieren: 



k l 



^2 _ ( n u nij) 

z — 1 j — l Uij 

heißt quadratische Kontingenz oder „Chi 2 “. Die quadratische Kontingenz 
kann beliebig große Werte (in Abhängigkeit von n) annehmen und eignet 
sich daher nicht zu Vergleichen. Diesen Mangel hat der Kontingenzkoef- 
fizient 



I< = 



X 2 + n 



nicht; sein Maximum 



K max = yf mit M = min{fc, /} 

ist unabhängig von n, hängt allerdings noch von der Tabellengröße ab. 
Durch Normierung erhält man den normierten Kontingenzkoeffizienten 



IC = A/A max 



Es gilt: 

X,Y unabhängig ^=>x 2 = A' = IC — 0. 

Da für die Wertebereiche X 2 > 0, 0 < K < A r max < 1 und 0 < IC < 1 
gilt, ist die Stärke der Abhängigkeit am einfachsten am Wert von IC 
abzulesen. Zudem nimmt IC sein Maximum 1 genau dann an, wenn X 
und Y perfekt abhängig sind, d.h. das eine Merkmal eine Funktion des 
anderen ist. 

Für unser Beispiel berechnet man: x 2 = 846.91; I\ = 0.117; A"* = 0.165. 
Also liegt nur ein schwacher Zusammenhang vor. 



1.4.2 Ordinalskalierte bivariate Merkmale 

Zur Festlegung ordinaler Assoziationsmaße , auch chorische Korrelationsko- 
effizienten genannt, sind einige vorbereitende Definitionen notwendig: 

• Sei (x\, y\ (x n , y n ) der bivariate Datensatz (Urliste), wobei (z,-,^) 
das Ausprägungspaar für die i-te statistische Einheit der Erhebung be- 
zeichnet. Beide Merkmale seien zumindest ordinalskaliert. Dann lassen 
sich sowohl die Ausprägungen von X als auch die von Y der Größe nach 
ordnen. 

• Sind zwei Ausprägungen in einer Variablen identisch ( Xi — Xj für i / j), 
so spricht man von verbundenen Beobachtungen oder Bindungen („ties“). 
Wir bezeichnen mit Tx bzw. Ty die Anzahl der Bindungen bezüglich X 
bzw. y. 
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• Steht X{ ( yi ) in der Rangordnung der der Größe nach aufsteigenden Folge 
der Ausprägungen von X (K) an r,- (sj)-ter Stelle, so heißt r,* (s{) die 
Rangzahl oder der Rangwert der i-ten Ausprägung X{ (yi). Bei Bindungen 
wird die jeweilige durchschnittliche Rangzahl zugeordnet. 

• Gilt für zwei Beobachtungspaare (ar* , y») und (xj,yj) entweder Xi < xj 
und yi < yj oder Xi > Xj und yi > yj, so heißen sie konkordant. Gilt 
andernfalls entweder Xi < Xj und yi > yj oder Xi > xj und y a - < yj, 
so heißen sie diskordant. Mit P bzw. Q bezeichnen wir die Anzahl der 
konkordanten bzw. diskordanten Wertepaare einer bivariaten Meßreihe. 

Eine Reihe von Definitionen ordinaler Assoziationsmaße gehen auf Kendall 
(1938) zurück und benutzen die normierte Differenz P — Q als Maßzahl: 

• Goodman und Kruskals Gamma , 7 = (P — Q)/(P + Q), läßt sich als ein 
PRE-Maß (proportional reduction of error) interpretieren. Es ist gleich 
-fl(-l), falls keine diskordanten (konkordanten) Wertepaare auftreten. 

• Kendalls Tau , r = (P - Q)/ (2) ? ls ^ gleich +1 (-1), falls alle Wertepaare 
konkordant (diskordant) sind, d.h. P = (”) ( Q = (2)). 

• Ti — (P — Q)/y/(P + Q + Tx)(P 4- Q 4- Ty) berücksichtigt auch Bindun- 
gen, nimmt in den gleichen Fällen wie Kendalls Tau die Extremwerte ±1 
an. 



Die Extremwerte ±1 können für die letzten beiden Maße nur im Falle qua- 
dratischer Tabellen mit k = / = n angenommen werden. Allen drei Maßen 
gemeinsam ist, daß sie den Wert 0 genau dann annehmen, wenn P — Q ist. 

Die Rangzahlen selbst wurden von Spearman (1904) zur Definition eines 
ordinalen Assoziationsmaßes benutzt: 

„ E? = ifo-f)(«,--5) 

5 VE'U^-ryZ'Uisi-s) 2 

heißt Rangkorrelationskoeffizient nach Spearman. Er ist äquivalent mit 



rs — 1 



6 ELi d 'i 

(n — l)n(n + 1) 



mit di = ri — , 



falls keine Bindungen auftreten. Da er nichts anderes als der für kardinal- 
skalierte Merkmale definierte Korrelationskoeffizient (siehe Abschnitt 1.4.3) 
der Rangzahlen ist, gilt -1 < rs < 1, wobei rs = -fl genau dann, wenn die 
Rangzahlen von X und Y gleich sind, und rs = — 1 genau dann, wenn sie 
gegenläufig übereinstimmen, d.h. r,* = s n _i+i (i = 1 , . . . , n). 

Zur Berechnung der Assoziationsmaße ist es zweckmäßig, zuvor die Beob- 
achtungspaare hinsichtlich der Größe der Merkmalsausprägungen eines Merk- 
mals (z.B. X) zu ordnen. 
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1.4.3 Kardinalskalierte bivariate Merkmale 

a) Korrelaiionsrechnung 

Ausgangspunkt jeder Analyse des Zusammenhangs zwischen zwei kar- 
dinalskalierten Merkmalen ist das sogenannte Streuungsdiagramm: Die 
Wertepaare (x t -, t/ t ) (i = 1, . . . , n) werden in ein kartesisches Koordinaten- 
kreuz eingezeichnet, wobei X auf der Abszisse und Y auf der Ordinate 
abgetragen wird. Es ergibt sich die sogenannte „ Punkt wolke“. Betrach- 
ten wir in Abbildung 1.8 vier idealtypische Fälle: Verschieben wir jeweils 







Abbildung 1.8: Streuungsdiagramme 

den Ursprung des Koordinatensystems in den Schwerpunkt (x, y), so wird 
folgendes deutlich: 

• Im Falle (1) liegen die Beobachtungspunkte relativ zum neuen Ur- 
sprung vorwiegend im 1. und 3. Quadranten, also 

1 n 

sxy = - - x)(yi - y) > 0 . 

• Im Falle (2) liegen die Beobachtungspunkte relativ zum neuen Ur- 
sprung vorwiegend im 2. und 4. Quadranten, also sxy < 0. 

• Im Falle (3) verteilen sich die Beobachtungspunkte relativ zum neuen 
Ursprung fast gleichmäßig auf alle Quadranten, also sxy & 0. 
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• Im Falle (4) liegt eine parabolische Beziehung zwischen X und Y ten- 
denziell vor, die aber an der Größe von sxy nicht erkennbar wird. 

Halten wir also fest: sxy , die Kovarianz von X und Y, erlaubt Aussa- 
gen über die Richtung der Abhängigkeit. X ) Y heißen korreliert , falls 
sxy 7^ 0 gilt, andernfalls unkorreliert. Fall (4) in Abbildung 1.8 zeigt, 
daß aus der Unkorreliertheit von X, Y nicht unbedingt auf die (statisti- 
sche) Unabhängigkeit der beiden Merkmale geschlossen werden darf. In 
der Tat ist sxy — 0, wenn die Verteilung von X völlig symmetrisch um 
x ist und Y = (X — x) 2 gilt, also Y perfekt von X abhängt (K* = 1). 

Jedenfalls ist sxy > 0, wenn X und Y sich gleichläufig verhalten ( positive 
Korrelation ), und sxy < 0, falls sie sich gegenläufig verhalten ( negative 
Korrelation). Weiter gilt 

5 aX+6Y — °^ s \ + b 2 Sy + 2absxY • 

Also sind X, Y genau dann unkorreliert, wenn s^+Y = s x + S Y- 

Der absolute Wert von sxy ist jedoch noch vom Maßstab der Merkmale 
abhängig. In der Tat gilt: 

Z — a bXj W = c + dY =>■ szw = bdsxY • 

Zur Normierung dividiert man die Kovarianz durch das Produkt der 
beiden Standardabweichungen und erhält den Korrelationskoeffizienten 
(nach Bravais-Pearson) (Maßkorrelationskoeffizient, Produkt-Moment- 
Korrelationskoeffizient) 

~ *)(«» ~ v) 

s * s r VT,i=i( x i - *) 2 E"=i(w - y ) 2 

Da, wie wir unten sehen werden, — 1 < r < 1 gilt und r maßstabsun- 
abhängig ist, gibt r nicht nur über die Richtung (Vorzeichen von r und 
sxy stimmen überein) sondern auch über die Stärke der Korrelation (ab- 
soluter Wert von r) Aufschluß. Die Extremwerte ±1 werden genau dann 
angenommen, wenn alle Punktepaare (x,-, y,-) auf einer Geraden liegen: 

\r\ = 1 => y { — a bx{ , i = 1, . . .,n, b — a — y - bx. 

Sx 

Ein hoher Wert von |r| und damit hohe Korrelation zeigt einen starken 
linearen Zusammenhang von X und Y an (die Punktwolke läßt sich gut 
durch eine Gerade approximieren). Aussagen über Ursachen eines solchen 
Zusammenhangs lassen sich allerdings aus r nicht ableiten. 

b) Grundlagen der Regressionsrechnung. 

Während in der Korrelationsrechnung die beiden Merkmale X und Y 
symmetrisch behandelt werden (man beachte die Formeln für sxy bzw. 
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r), geht man in der Regressionsrechnung von einer asymmetrischen Be- 
ziehung aus. Die Bezeichnung der Merkmale sei so gewählt, daß Y die 
abhängige und X die unabhängige Variable ist. Man spricht von einer 
Regression von Y auf X, wenn in das Streuungsdiagramm eine Funk- 
tion y = f(X) an die aus den Beobachtungspaaren bestehende Punkt- 
wolke so angepaßt wird, daß die aufgrund der Funktion berechneten Werte 
y\ = f(x{) möglichst nahe an den jeweils beobachteten Werten yi liegen 
und / eine möglichst einfache funktionale Gestalt aufweist (würde man 
beliebige Funktionen zulassen, wäre ein perfekter „fit“ immer möglich). 

Man spricht von einer linearen Regression , wenn f(x) = a + bx gesetzt 
wird. Zur Bestimmung der Regressionskoeffizienten a, b bedient man sich 
des auf C. F. Gauß (1777-1855) zurückgehenden Prinzips der kleinsten 
Quadrate (KQ-Prinzip): Man wähle a und b in der Regressionsgleichung 
y'i = a + bx{ so, daß die Summe der Quadrate der Abweichungen e; von 
den beobachteten Y- Werten minimal wird: 

E e l = E (y'i ~Vif — ► Min! 

i=l i= 1 

Diese Extremwertaufgabe führt im Falle von s 2 x > 0 zu den folgenden 
Normalgleichungen (Nullsetzen der partiellen Ableitungen der Quadrat- 
abweichungssumme nach den Regressions parametern) 

n n 

E& = na + b^Xi 

i=l i — 1 

n n n 

= a^Xi+b^xj, 

* = 1 * = 1 i= 1 

die a , b eindeutig festlegen. Auflösung nach a und b ergibt 
a = y — bx 

. sxy E"=i( x >' - *)(&• - 9 ) 

4 Er=i(^-^) 2 ' 

Somit stimmt das Vorzeichen von b mit dem der Kovarianz überein. Steigt 
X um eine Einheit, so verändert sich Y im Durchschnitt um b Einheiten. 

Als Maß für die Güte der Anpassung verwendet man das Bestimmtheits- 
maß (Bestimmtheitskoeffizient) 

B= Ei=M-y) 2 
Ei=i(vi-y) 2 ' 

Der Streuungszerlegungsformel 

E(«/i - y) 2 = E(y* - 1 ii) 2 + E(j4 - y) 2 

i = l t = l i = l 
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für die mit dem KQ-Prinzip berechnete Regressionsgleichung y[ — a-\- bx{ 
entnimmt man, daß B normiert ist, 0 < B < 1, und daß B — 1 genau 
dann gilt, wenn die Abweichungsquadratsumme verschwindet, d.h. alle 
Beobachtungspaare auf der Regressionsgeraden liegen. B • 100% wird als 
der durch die lineare Regression von Y auf X erklärte Varianz anteil von 
Y bezeichnet. 

Durch einfache Umformungen erhält man die Beziehung B = r 2 , was die 
oben erwähnten Eigenschaften von r beweist. Aus dieser Beziehung folgt 
auch, daß sich für die umgekehrte Regression von X auf Y, 

= g(y ) = a! + b'y, 

der gleiche Wert des entsprechend definierten Bestimmtheitsmaßes ergibt 
(r 2 ist ja symmetrisch in X und Y). Für diese „inverse“ Regression erhält 
man mit der KQ-Methode 

a' = x — b'y, b' = s X Y/sy. 



Aufgabe 1.4/1 Folgende Kontingenztabelle sei gegeben: 





2 


4 


6 


8 


10 


4 


1 


4 


3 


20 


3 


3 


0 


0 


30 


4 


1 


4 


3 



a) Sind die Merkmale X, Y unabhängig? 

b) Bestimmen Sie x . 

c) Bestimmen Sie h(Y\X = 30). 

Aufgabe 1.4/2 Gegeben seien die folgenden 12 Beobachtungen des zweidi- 
mensionalen Merkmals (X, Y): 

(1,1),(2, 3), (2,1), (2, 2), (1,2), (2,1), (1,1), (2,1), (2, 3), (1,3), (2,1), (2, 2) 

a) Erstellen Sie die Kontingenztabelle. 

b) Sind X, Y unabhängig? 



Aufgabe 1.4/3 Gegeben sei folgender bivariater Datensatz ordinalskalierter 
Merkmale: 



(5, 8), (7, 9), (2,4), (1,6), (6,6) 
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Bestimmen Sie den Wert von 7, r, r& und r$ und interpretieren Sie die 
Ergebnisse. 



Aufgabe 1.4/4 Bei verschiedenen Computershops werden die Absatzzahlen 
für Kleinrechner und die Werbeausgaben ermittelt. Durchschnittlich liegen 
die Absatzzahlen bei 50 Stück (Standardabweichung 10) und die Werbeausga- 
ben bei 10000 DM (Standardabweichung 2000). Gleichzeitig wurde der Wert 
0.8 als Korrelationskoeffizient zwischen diesen beiden Merkmalen ermittelt. 
Errechnen Sie die Regressionsgerade mit Hilfe des KQ-Prinzips. 



Aufgabe 1.4/5 

a) Für eine 2-dimensionale Häufigkeitsverteilung liegt folgende unvollständi- 
ge Kontingenztabelle vor: 



x\y 


1 3 5 




2 


10 20 




4 


20 


60 






100 



al) Vervollständigen Sie die Kontingenztabelle unter der Voraussetzung, 
daß y =3 ist. 

a2) Bestimmen Sie h(Y\X = 4). 
a3) Bestimmen Sie F( 4, 1). 

b) Ergänzen Sie die folgende Kontingenztabelle für den Fall, daß X und Y 
unabhängig sind. 





yi V 2 




*1 


60 


0 

0 


X2 




900 



Aufgabe 1.4/6 Eine Erhebung im Wohnungsbau ergab bei 50 ausgewählten 
Bauobjekten folgendes Ergebnis hinsichtlich der Merkmale X=„Vollwärme- 
schutz“ und Y=„ Fertigstellungsjahr“: 



xV 


< 1975 


> 1975 


ohne 


6 


4 


mit 


14 


26 



Begründen Sie die Auswahl einer geeigneten Maßzahl, um den Zusammen- 
hang der Variablen in dieser Gruppe zu kennzeichnen, berechnen Sie diese 
und werten Sie das Ergebnis aus. 
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Aufgabe 1.4/7 



a) Welcher Zusammenhang besteht zwischen dem Regressionskoeffizienten 
6, dem Korrelationskoeffizienten r und der Kovarianz für standardisierte 
Merkmale X und Y? 

b) Gegeben sind die folgenden Wertepaare: 



Xi 


i 


1 


2 


3 


3 


4 


5 


5 


Vi 


7 


5 


3 


4 


2 


3 


1 


1 



Berechnen Sie die Parameter einer linearen KQ- Regressionsfunktion mit 
X als unabhängiger Variablen. 



Aufgabe 1.4/8 Die Lebenserwartung bei Geburt (Geburtsjahre 1950, 1960, 
. . . , 1990) betrug in Jahren: 



Geschlecht 


1950 


1960 


1970 


1980 


1990 


weiblich 


68.0 


71.4 


73.3 


74.6 


76.4 


männlich 


63.9 


66.5 


68.1 


68.7 


70.1 



(Quelle: Institut der Deutschen Wirtschaft/Köln: Zahlen zur wirtschaftli- 
chen Entwicklung der BRD, Ausgabe 1991; für 1990 vorläufige Zahlen.) 

a) Beschreiben Sie die tendenzielle Entwicklung der Lebenserwartung für 
Frauen bzw. Männer in Abhängigkeit vom Geburtsjahr und interpretieren 
Sie die Ergebnisse! 

b) Beurteilen Sie die Güte Ihrer Aussagen! 



Ergänzungen und Bemerkungen 

• In der Literatur und der statistischen Software werden unter der Über- 
schrift „ Assoziationsmaße “ eine Reihe weiterer Maßzahlen für die Stärke 
der Abhängigkeit zwischen zwei nominalskalierten Merkmalen betrach- 
tet. So enthält SPSS/PC+ die von \ 2 abgeleiteten Maße 4> = \Jx? ! n 
(Phi-Koeffizient) und V = \/x 2 /[ n (M - 1)] (Cramers V) sowie eine auf 
Goodman und Kruskal (1954) zurückgehende Maßzahl, die angibt, wie 
sich die Vorhersage der Ausprägung einer statistischen Einheit in einer 
Variablen durch Ausnutzung der Information über deren Ausprägung in 
der anderen Variablen verbessern läßt (PRE-Maß Lambda). Vgl. hierzu 
auch Everitt (1970). 

• Der Kontingenzkoeffizient wurde von Pearson (1904) als Assoziationsmaß 
eingeführt. Die obere Schranke K m ax für den Kontingenzkoeffizienten 
wurde von Pawlik (1959) hergeleitet. 
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• Einen Überblick über die verschiedenen Rangkorrelationskoeffizienten, 
die zwischen ihnen bestehenden Beziehungen und ihre Eigenschaften fin- 
det der interessierte Leser im Klassiker von Kendall (1948), sowie in 
Hildebrand/Laing/Rosenthal (1977). Als deutschsprachige Literatur sei 
Büning/Trenkler (1978) empfohlen. 

• In 1.4.3.b) wurde die einfache lineare Regression von Y auf X dargestellt. 
Nichtlineare Regressionen sowie weitere komplexere Regressionsmodelle 
werden ebenfalls im Rahmen der Dependenzanalyse in der Ökonometrie 
untersucht (vgl. Bamberg/Schittko (1979) oder Hübler (1989)). 



1.5 Datenreduktion 

Zur Reduktion großer Datensätze bieten sich Methoden zur Variablenreduk- 
tion oder Methoden zur Reduktion der Fallzahl an. 



1,5.1 Faktorenanalyse zur Variablenreduktion 

Sind die ursprünglich erhobenen Merkmale X \, . . . , X p korreliert, d.h. werden 
durch sie nicht wirklich überschneidungsfreie Eigenschaften der statistischen 
Einheiten gemessen, so „verbergen“ sich hinter ihnen möglicherweise ein 
oder mehrere gemeinsame nicht beobachtete (latente) Faktoren Fi, . . . , F m 
(ra < p). Diese Faktoren gilt es, aus dem Datensatz mittels der festgestellten 
Abhängigkeitsstruktur zu extrahieren. Gelingt dies, so kann dadurch eine 
Reduktion des Datensatzes erfolgen: Statt der Ausprägungen in X \, . . . , X p 
kann jede statistische Einheit durch ihre Ausprägung in den gemeinsamen 
Faktoren charakterisiert werden. Multivariate Datensätze können so mögli- 
cherweise in univariate oder bivariate transformiert werden. 

Liegen n Beobachtungen in den Variablen X \, . . . , X p vor, so ist die Da- 
tenmatrix 

( zn • • • zi p ^ 

= - ; 

Znl ■ * ■ z n p J 

der Ausgangspunkt der Analyse. Häufig standardisiert man die Variablen, 
d.h. man bildet Z{j = (xij — Xj)/sj ( Sj bezeichne die Standardabweichung 
von Xj) und erhält die standardisierte Datenmatrix 



( zu 



Z = 



\ z nl 



z l p ^ 
z np ) 



Sind die Variablen kardinalskaliert, so lassen sich zwischen den Variablen die 
Maßkorrelationskoeffizienten berechnen und in der symmetrischen Korre- 
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lationsmatrix 



rn 


• r ip \ 


r P 1 ' 


' ' r pp ) 



zusammenfassen. R repräsentiert die Ähnlichkeitsstruktur zwischen den Va- 
riablen und entspricht der Varianz-Kovarianzmatrix der standardisierten Va- 
riablen . . . , Z p . In Matrixschreibweise gilt: 



R = -Z'Z . 

n 



Für die Faktorenanalyse (FA) macht man folgende Annahmen: 

• Das faktorenanalytische Grundmodell läßt sich durch folgendes Schema 
veranschaulichen : 



Zi — f/i 
F 1: ...F m (j. : : : 

Z p «— U p 

Beobachtbar sind dabei die standardisierten Variablen Z\,...,Z P , die 
durch gemeinsame Faktoren F\ t . . . , F m und die Einzelfaktoren U \ , . . . , U p 
darstellbar sind. Dabei sollen die Faktoren so bestimmt werden, daß F\ 
möglichst viel Variation der Ausgangsdaten erfaßt, die Rest varianz am 
besten durch F 2 erfaßt wird, usw. Für spätere Datenanalysen können 
dann die Ausprägungen der wichtigsten gemeinsamen Faktoren den ur- 
sprünglichen Datensatz ersetzen. 

• F 1 * , Ui seien standardisierte nicht beobachtete Variable. 

• Es gilt 

Zi = bi\F\ + • • • -f bi m F m + diUi (i = 1, . . . , p ), 

d.h. die beobachtbaren Variablen lassen sich als Linearkombination der 
latenten Variablen darstellen. Unter Benutzung der Matrixschreibweise 
läßt sich diese Annahme für n Beobachtungswerte wie folgt fassen: 



Z = FB f - b UD mit 



F = 





hl • 


flm 


\ 




«n • 


• • Ulp 










, u = 








fnl 


fnm 






«nl ' 


Unp 



B = 



bn ■ 


* * hm ^ 




di 


0 \ 






, D = 






\ b p i 


b p m / 




0 


dp ) 
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Dabei nennt man F die Matrix der Faktorenwerte (factor scores), B die 
Faktorladungsmatrix und die bzw. die Faktorladungen. Die Matrix 
(B | D) wird oft auch als Faktorenmuster bezeichnet. 

• Es gilt: 



SF t Uj = sUjU k = 0 (i = 1 , . . .m, k, j = 1 . . .p, k ± j ), 

d.h. die latenten Variablen sind unkorreliert. In Matrixschreibweise lautet 
die Annahme wie folgt 



-U'U = I, U'F = 0, 
n 

wobei I die Einheitsmatrix bezeichnet. 

Aus den gemachten Annahmen folgt dann 

R = BCB’ + DD', 

wobei C die Varianz-Kovarianzmatrix der Faktoren ist. Wird zusätzlich 
sp it Fj = 0 (i ^ j) (unkorrelierte gemeinsame Faktoren) 
gefordert, so folgt 

R = BB' + DD'. 

Diese Gleichungen für R bezeichnet man als Fundamentaltheorem der Fakto- 
renanalyse. 

Für die Matrix 

R h — R- DD ' 

ergibt sich unter Gültigkeit der Unkorreliertheit der gemeinsamen Faktoren 
die Gleichung 

R h = BB 

und damit gilt für die Hauptdiagonalelemente der Matrix R die Varianzzer- 
legung: 

m 

4 . = 1 = J2 b h +d l 

j - 1 

Die Summe 

m 

j- 1 

heißt Kommunalität der 2 -ten Variablen, 

p 

E*? 

l — l 
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heißt Gesamtkommunalität. 

Die Bestimmung der Faktorladungen und der Faktoren (Faktorenextrak- 
tion) ist nicht eindeutig möglich, da die Annahmen das Modell nicht identi- 
fizierbar machen. Verschiedene Modell Varianten, bei denen es immer darum 
geht, eine gegebene Korrelat ions- oder Kovarianzmatrix durch eine einfache 
Faktorenstruktur möglichst gut zu repräsentieren, unterscheiden sich deshalb 
in den folgenden Schritten: 

• Vorgabe der Zahl der Faktoren 

Bei der Hauptkomponentenmethode (PCA) werden genausoviele Faktoren 
wie erhobene Variable bestimmt. Bei der Hauptfaktorenmethode (PFA) 
wird die Zahl der Faktoren, die hier kleiner als die Zahl der Variablen 
sein kann, nach bestimmten Abbruchkriterien anhand des vorliegenden 
Datensatzes festgelegt. 

• Vorgabe der Kommunalitäten 

Bei der PCA wird hl = 1 gesetzt, d.h. Rh = R angenommen. Für die PFA 
sind verschiedene Kriterien im multivariaten Fall vorgeschlagen worden, 
z.B. Kl — maxj |r,- ; -|. 

• Verfahren zur Faktorenextraktion 

Bei der PCA und der PFA werden die Faktoren so extrahiert, daß der 
erste Faktor den größtmöglichen Teil der Varianz erklärt, usw. In beiden 
Fällen erfordern die Extraktionsverfahren die Lösung von Eigenwert- und 
Eigen vektorproblemen . 

• Rot at ions verfahren 

Ein Übergang von rechtwinkligen, d.h. unabhängigen Faktoren, zu neuen 
rechtwinkligen oder zu möglicherweise sogar schiefwinkligen, d.h. abhängi- 
gen Faktoren, erleichtert oft die Interpretation der Ergebnisse (Einfach- 
struktur). 

• Berechnung der Faktorenwerte 

Bei der PCA können die Faktorenwerte direkt berechnet werden; bei der 
PFA können sie nur näherungsweise bestimmt werden. 

Die zur Verfügung stehenden Softwarepakete stellen für die verschiedenen 
Schritte eine Reihe unterschiedlicher Optionen bereit. 

1.5,2 Clusteranalyse zur Reduktion der Fallzahl 

Neben der Möglichkeit, die Zahl der betrachteten Variablen mittels FA zu 
verringern, können große Datensätze möglicherweise auch dadurch reduziert 
werden, daß die Vielzahl der erhobenen statistischen Einheiten durch einige 
wenige Gruppenrepräsentanten in der weiteren Analyse vertreten werden. 

Geht man von der Ähnlichkeit der statistischen Einheiten aus, vergleicht 
man zunächst also die statistischen Einheiten hinsichtlich der zwei Variablen 
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mittels eines Ähnlichkeits- oder Distanzmaßes und versucht man darauf auf- 
bauend Gruppen homogener statistischer Einheiten zu bilden, so wendet man 
Verfahren der Clusteranalyse an. Ihr Ausgangspunkt ist also die symmetri- 

d\ n \ 
dnn / 

der Distanzen oder Ähnlichkeiten zwischen den Zeilen der Datenmatrix. 

Clusteranalytische Modelle setzen sich aus den folgenden Schritten zu- 
sammen: 

• Festlegung eines Ähnlichkeits- oder Distanzmaßes zwischen den statisti- 
schen Einheiten, z.B. durch die Euklidische Distanz 



sehe Distanz - oder Ähnlichkeitsmatrix 

l du 



D = 



\ d n i 



dik — 



p 

^2 {Xii - Xkjf, (i,k= 1, . . . , n). 
j = 1 



• Festlegung eines Ähnlichkeits- oder Distanzmaßes für Gruppen von stati- 
stischen Einheiten, z.B. kleinste Distanz bzw. größte Ähnlichkeit zwischen 
den Elementen zweier verschiedener Gruppen (nearest neighbour). 

• Festlegung eines Cluster- Algorithmus, z.B. beginnend mit der Gruppe, die 
aus den zwei statistischen Einheiten mit minimaler Distanz besteht, wer- 
den schrittweise diejenigen Elemente hinzugefügt, die minimalen Kleinst- 
Abstand zu den bisherigen Gruppenmitgliedern haben, bis dieser Abstand 
einen Grenzwert überschreitet, dann wird mit einer neuen Gruppe begon- 
nen usw., bis das Verfahren abbricht (agglomeratives Verfahren, single 
linkage). 

Die üblichen statistischen Softwarepakete enthalten in der Regel nur wenige 
clusteranalytische Verfahren, so daß sich der Einsatz spezieller Software (wie 
z.B. CLUSTAN) zur Reduktion der Fallzahl empfiehlt. 

Aufgabe 1.5/1 „Leute, die viel reisen, haben Glück, sind reich, kennen sich 
in der Welt aus, während die Daheimhocker kein Geld oder kleine Kinder 
haben, zu alt oder nicht gesund sind.“ (Aus einer amerikanischen Untersu- 
chung, nach DIE ZEIT, 2. 1. 1981, S. 39.) Sind Sie vom Ergebnis dieser 
Studie beeindruckt? 



Aufgabe 1.5/2 Warum lassen sich die Faktorenladungen in der FA nicht 
mittels KQ-Methode wie bei der Regressionsrechnung bestimmen? 
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Ergänzungen und Bemerkungen 

• Verfahren, die sich auf die Analyse der Zusamenhänge zwischen Variablen 
beziehen, nennt man R-Techniken. Zu ihnen zählt die FA. Verfahren, 
die sich auf die Analyse der Zusammenhänge zwischen den statistischen 
Einheiten beziehen, nennt man Q-Techniken. Die Clusteranalyse ist ein 
Beispiel für eine Q-Technik. Allerdings ist diese Einteilung nicht sehr 
trennscharf. So läßt sich die FA, angewandt auf die Zeilen statt der Spal- 
ten der Datenmatrix Z, auch clusteranalytisch und damit als Q-Technik 
einsetzen. 

• Während bei Faktoren- und Clusteranalyse die Beobachtungsvariablen 
symmetrisch behandelt werden, erfordert die Regression die Einteilung 
der Variablen in (eine) abhängige und unabhängige Variablen. In vielen 
Lehrbüchern wird im zweiten Fall von ökonometrischen Verfahren gespro- 
chen. 

• Zur Geschichte der FA, aber auch zur Tradition der Fehlinterpretation ih- 
rer Ergebnisse — insbesondere auf dem Gebiet der Intelligenzmessung — sei 
das spannend geschriebene Buch von Gould (1988) zur Lektüre empfohlen. 
Als Begründer der FA werden üblicherweise Ch. Spearman (1863-1945) 
und F. Galton (1822-1911) genannt. Die PCA geht auf veröffentlichte Ar- 
beiten von K. Pearson und H. Hotelling in den Dreißiger Jahren zurück. 

• Faktoren- und clusteranalytische Verfahren sind natürlich insbesondere 
im Falle von p > 2 Variablen interessant. Man spricht dann von mul- 
tivariater Statistik. Eine umfassende Darstellung multivariater Statistik 
bieten Chatfield/Collins (1980), Hartung/ Elpelt (1984) oder Backhaus 
u. a. (1987). Darüber hinaus gibt es zahlreiche Einzeldarstellungen wie 
zum Beispiel Arminger (1979) und Kim/Mueller (1978) zur FA oder Bock 
(1973) und Aldenderfer/Blashfield (1984) zur Clusteranalyse oder Ehren- 
berg (1982) zur Datenreduktion. 




Kapitel 2 

Grundzüge der Wahr- 
scheinlichkeitsrechnung 
und ausgewählte Wahr- 
scheinlichkeitsverteilungen 



Die induktive Statistik verfolgt das Ziel, aus Ergebnissen über zufällig aus 
der Grundgesamtheit ausgewählte statistische Einheiten Aussagen über die 
Grundgesamtheit herzuleiten. Diese Aussagen sind in der Regel mit Unsicher- 
heiten behaftet. Die mathematische Disziplin, die sich mit der Beschreibung 
von Zufallsvorgängen befaßt, die die Unsicherheit quantitativ abzuschätzen 
erlaubt, ist die Wahrscheinlichkeitsrechnung bzw. -theorie. 

In den Abschnitten 2. 1-2 .4 werden grundlegende Konzepte der Wahr- 
scheinlichkeitsrechnung zur Beschreibung beliebiger Zufallsexperimente ein- 
geführt. Für die Statistik sind jedoch einige spezielle Experimente von In- 
teresse. Soweit diese zu diskreten Zufallsvariablen führen, werden sie in den 
Abschnitten 2. 5-2. 9 gesondert behandelt. 

Die Bedeutung spezieller stetiger Wahrscheinlichkeitsverteilungen für die 
Statistik hat im wesentlichen zwei Gründe: 

• die Möglichkeit, diskrete Verteilungen durch leichter zu handhabende ste- 
tige Verteilungen zu approximieren (Grenzwertsätze), 

• der Einsatz spezieller stetiger Verteilungen als Modellverteilung zur Be- 
schreibung komplexer stochastischer Phänomene. 

Die Abschnitte 2.10-2.13 enthalten die Vorstellung wichtiger spezieller steti- 
ger Verteilungen. Im abschließenden Abschnitt 2.14 werden wichtige Grenz- 
wertsätze dargestellt. 
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2.1 Grundbegriffe der Wahrscheinlichkeits- 
rechnung 

Ausgangspunkt der Überlegungen in diesem Abschnitt ist der Begriff „Zufalls- 
experiment“ oder „Zufallsvorgang“ . Darunter versteht man einen Vorgang, 

• der nach bestimmten, festen Regeln abläuft und prinzipiell beliebig oft 
wiederholbar ist, 

• der zu verschiedenen, sich gegenseitig ausschließenden möglichen Ergeb- 
nissen führen kann, die alle bekannt sind, 

• dessen konkreter Ausgang jedoch im voraus unbekannt ist. 

Beispiele für Zufallsvorgänge sind das einmalige Werfen eines Würfels oder 
einer Münze, die Ziehung der Lottozahlen oder das Ziehen einer Zufallsstich- 
probe vom Umfang n aus einer gegebenen endlichen Grundgesamtheit. Aber 
auch komplexere Vorgänge lassen sich als Zufallsvorgänge interpretieren. 

Die möglichen sich gegenseitig ausschließenden Ereignisse u eines Zu- 
fallsexperiments nennt man Elementarereignisse und ihre Gesamtheit ß be- 
zeichnet man als Ergebnisraum . Im Falle des einmaligen Werfens eines 
Würfels besteht der Ergebnisraum aus der Menge der möglichen „Augen- 
zahlen“: {1, 2, 3, 4, 5, 6}. Betrachtet man eine Zufallsstichprobe vom Um- 
fang n als Zufallsexperiment, so sind für n = 1 die Elementarereignisse ge- 
rade die statistischen Einheiten der Grundgesamtheit (wir setzen hier und 
im folgenden voraus, daß die statistischen Einheiten der Grundgesamtheit 
mit den Auswahleinheiten der statistischen Untersuchung übereinstimmen); 
allgemein sind es n-tupel (xi, . . . , x n ) mit X, aus der Grundgesamtheit. 

Neben den Elementarereignissen sind auch beliebige (zusammengesetz- 
te) Ereignisse interessant. So könnten wir uns im Falle des Würfelwerfens 
für das Eintreten des Ereignisses A = „eine gerade Zahl fällt“ interessieren. 
A läßt sich mit der Teilmenge {2,4,6} von ß identifizieren. Ganz allgemein 
entsprechen beliebige Teilmengen von ß möglichen (sich nicht mehr notwen- 
digerweise ausschließenden) Ergebnissen des Zufallsexperiments (Ereignisse). 
Die aus der Mengenlehre bekannten Verknüpfungsoperationen für Mengen 
lassen sich auf Ereignisse übertragen. Seien A, B Ereignisse, also Teilmengen 
von ß: 

• Die Menge A fl B besteht aus allen Elementarereignissen, die sowohl in A 
als auch in B enthalten sind. An B entspricht dem Ereignis „A und B 
treten ein“. 

• Die Menge A U B besteht aus allen Elementarereignissen, die in A oder 
in B enthalten sind. A U B entspricht dem Ereignis „A oder B tritt ein“ 
(hier ist nicht das „ausschließende oder“ gemeint). 
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• Die Menge Ä = Q\ A besteht aus allen Elementarereignissen, die nicht in 
A enthalten sind. Ä entspricht dem Ereignis „A tritt nicht ein“ und heißt 
Komplement von A. 

Betrachtet man als Beispiel das Zufallsexperiment „Einmaliges Werfen eines 
Würfels“ und sei A = {2,4,6} („eine gerade Zahl fällt“) und B = {1,3,5} 
(„eine ungerade Zahl fällt“), so gilt: 

• A fl B = 0, d.h. kein Elementarereignis kann auftreten, das sowohl in A 
als auch in B liegt (keine der Zahlen von 1 bis 6 ist gerade und ungerade 
zugleich). Man nennt 0 allgemein das unmögliche Ereignis. Gilt AC\B = 
0, so heißen A, B disjunkte Ereignisse. 

• A U B = Q, d.h. jedes Elementarereignis gehört zu A oder zu B. Q heißt 
deshalb auch das sichere Ereignis. Gilt A U B = Q und sind gleichzeitig 
A, B disjunkt, so spricht man von einer Zerlegung von Q. Allgemein gilt: 
{A n } n€ ]\I bildet eine Zerlegung von Q, wenn gilt: U n A n = Q (die Mengen 
A\, A 2 , . . . sind erschöpfend) und A{ D Aj — 0 für alle i ^ j (die Mengen 
A\, A 2 , . . . sind paarweise disjunkt). 

• Ä = B, d.h. ein Elementarereignis, das nicht in A liegt, muß in B liegen. 

Wie lassen sich nun Ereignissen und ihren Verknüpfungen Zahlen zuordnen, 
die sich als „Wahrscheinlichkeiten des Eintretens der betreffenden Ereignisse“ 
interpretieren lassen? 

• Ist der Ergebnisraum endlich (|Q| = N), so läßt sich für alle Teilmengen 
A von eine Wahrscheinlichkeit wie folgt festlegen: 

t _ Anzahl der günstigen Fälle für A _ \A\ _ 1 , . . 

Anzahl der möglichen Fälle |Q| N 

Im Beispiel „Werfen eines Würfels“ erhält man W{A)—^ • 3=^ für A — 
{2,4,6}. 

Dieser sogenannte klassische Wahrscheinlichkeitsbegriff (er stammt von 
Laplace (1749-1827)) ordnet jedem Elementarereignis die Wahrschein- 
lichkeit 1 /N zu. Man spricht deshalb auch von einem „Gleichmöglich- 
keitsmodell “. Offensichtlich gilt 0 < W(A) < 1 für alle Teilmengen A 
aus Cl. (Wir schreiben A E P(ß), wobei P(ß) für die Potenzmenge von 
Q steht, die Menge aller Teilmengen von Q.) 

Man kann W also als Funktion von P(Q) in das Intervall [0,1] auffassen: 
W : P(J2) — [0, 1] mit W(Q) = 1 und W(Q) = 0. 

• Liegt ein beliebig oft unter gleichem Rahmenbedingungen wiederholba- 
rer Zufallsvorgang vor, so läßt sich mit Hilfe des relativen Häufigkeits- 
begriffs ein frequentistischer oder statistischer Wahrscheinlichkeitsbegriff 
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(er stammt von R. v. Mises (1883-1953)) einführen: Der Zufallsvorgang 
werde n mal durchgeführt und mit h n (A) die Anzahl der Durchführungen 
bezeichnet, bei denen A eintrat. Die Definition lautet dann 

W(A) — lim h n (A) 

n— mx) 

(Überlegen Sie, daß hier ebenfalls 0 < W(A ) < 1 gilt.) 

• Die allgemeinste Antwort auf das gestellte Problem ist die exakte Fassung 
des Wahrscheinlichkeitsbegriffs durch Kolmogoroff (*1903) axiomatischer 
W ahrscheinlichkeitsbegriff): 

Sei S eine Familie von Teilmengen (die Ereignisse) von A mit 

(51) A G S 

(52) Aes=>Äes 

(53) A u A 2 ,...eS^\J n A n eS 

und sei W eine Funktion W : S — ► [0, 1] mit 
(Wl) W(Q) = 1 

(W2) W (U„ A n ) = Y^n W(A n ) für alle Folgen {^n}„ e N von Ereignis- 
sen aus S, die paarweise disjunkt sind (d.h. Ai fl Aj = 0 für alle i ^ j) y 

dann heißt W Wahrscheinlichkeit ( Wahrscheinlichkeitsmaß ) auf fl. Die 
Eigenschaft (W2) wird als cr-Additivität bezeichnet, die Eigenschaften 
(S1)-(S3) machen S zu einer a- Algebra. Wir nennen S die Ereignisal- 
gebra. (Machen Sie sich klar, daß die klassische und die frequentistische 
Wahrscheinlichkeitsdefinition für S = P(A) alle Axiome von Kolmogoroff 
erfüllen und somit als Konkretisierung der axiomatischen Festlegung des 
Wahrscheinlichkeitsbegriffs betrachtet werden können. Mathematiker sa- 
gen: Kolmogoroff gab eine „implizite“ Definition, Laplace und v. Mises 
„explizite“ Definitionen der Wahrscheinlichkeit.) 

Aus den Axiomen ergeben sich eine Reihe von Rechenregeln. Die wichtigsten 
wollen wir hier festhalten: 

(W3) W(Ä) = 1 - W(A) 

( W4) W(A U B) = W(A) + W(B) - W{A n B) 

(W5) A C B => W(A) < W(B) und W(B \A) = W(B) - W(A) 

(W6) Ist {A n } neN eine Zerlegung von fl, so gilt W(B) = n A n ) 

für ein beliebiges Ereignis B G S. 

Definiert man 

W(A\B) = W( ^ ] falls W(B)>0, 
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so ist W('\B) ein Wahrscheinlichkeitsmaß auf B (mit Ereignisalgebra Sfl B = 
{AC\B\A E S}). W(-\B) heißt die durch das Ereignis B bedingte Wahrschein- 
lichkeit und W(A\B) läßt sich interpretieren als die Wahrscheinlichkeit für 
das Eintreten von A unter der Voraussetzung, daß B eintritt bzw. eingetreten 
ist. Es gilt dann: 

(W7) Sei Mn} n€ N e ^ ne Zerlegung von mit W(A n ) > 0 und A n E S für 
alle n E N. Dann gilt: 

a) Satz von der totalen Wahrscheinlichkeit 

W(B) = W(B\A n )W(A n ) 
neN 



b) Formel von Bayes 



W(Ai\B ) 



W(B\Ai)W(Ai ) 
E„ 6 N W{B\A n )W{A n ) 



für alle i. 



Man definiert außerdem: Zwei Ereignisse A,B heißen unabhängig genau 
dann, wenn 

(W8) W(AC\B) = W(A) W(B). 

Sind A, B unabhängig, so auch jeweils Ä, B und A, B und Ä, B. 



Aufgabe 2.1/1 Lassen sich die folgenden Aussagen adäquat mit dem oben 

entwickelten wahrscheinlichkeitstheoretischen Modell erfassen? 

a) „Es wäre ja doch reiner Zufall gewesen, wenn man in diesen fünf Ta- 
gen, das Fernsehgerät einschaltend, nicht den Papst getroffen hätte.“ 
(Süddeutsche Zeitung vom 20. 11. 1980, als der Papst Deutschland be- 
suchte.) 

b) „Der derzeitige Erkenntnisstand über Technologiewirkungen . . .rechtfer- 
tigt keine Wahrscheinlichkeitsaussage über die Entwicklung des Arbeits- 
plätzeangebots im kommenden Jahrzehnt.“ (Ein Arbeitsmarktexperte 
laut Capital 11/1980.) 

c) Laut dpa-Meldung vom 18. 10. 1980 „ist das Verletzungsrisiko von Fahr- 
zeuginsassen, die bei einem Unfall nicht angeschnallt sind, zehnmal 
höher.“ 

d) „Je länger ich ohne Sturz blieb, desto wahrscheinlicher wurde es, daß 
ich einen haben würde.“ (Ein Major über seine Erfahrungen bei der 
Kavallerie.) 

Machen Sie sich dabei insbesondere jeweils die Begriffe Zufallsexperiment, 

Elementarereignis, Ereignis, Ergebnisraum klar. 
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Aufgabe 2.1/2 

a) Sind disjunkte Ereignisse unabhängig? 

b) Zeigen Sie für A, B £ S mit W(A) > 0 und W(B) > 0: 

A, B unabhängig <=>W{A\B) = W(A) <=> W(B\A) = W(B). 

c) Sei ß = {u>i, . . . ,u; n } ein endlicher Ergebnisraum. Zeigen Sie, daß jeder 
Vektor (pi, . . . ,p n ) von Zahlen mit p* > 0 für alle i und J2*i=i Pi = 1 ein 
Wahrscheinlichkeitsmaß auf ß fest legt. 



Aufgabe 2.1/3 

a) Ein medizinischer Diagnosetest habe folgende Eigenschaften: 90% der 
Tests von Gesunden sind negativ, 90% der Tests von Kranken sind posi- 
tiv. Wie groß ist die Wahrscheinlichkeit, daß eine Person mit positivem 
Testergebnis tatsächlich krank ist, wenn die Wahrscheinlichkeit, daß eine 
sich der Untersuchung stellende Person krank ist, 0.1 beträgt? 

b) Wie groß ist die Wahrscheinlichkeit, aus einem Skatblatt zwei Könige zu 
ziehen, wenn 

bl) die beiden Karten nacheinander ohne Zurücklegen 
b2) die beiden Karten nacheinander mit Zurücklegen 
b3) die beiden Karten gleichzeitig 

gezogen werden? Welche Ereignisse sind hierbei unabhängig? 

c) „ ’Weiße Ostern sind eher wahrscheinlich als weiße Weihnachten’, mein- 
te ein Meteorologe mit Blick auf die Wetterstatistik der letzten Jahre.“ 
(Süddeutsche Zeitung 8. 12. 1980.) Diskutieren Sie anhand dieser Aussage 
die verschiedenen Wahrscheinlichkeitskonzepte. 

d) „Unmögliche Ereignisse haben die Wahrscheinlichkeit 0, Ereignisse mit 
Wahrscheinlichkeit 0 sind unmöglich.“ Wie beurteilen Sie diese Aussage 
in einem statistischen Lehrbuch? 



Ergänzungen und Bemerkungen 

• Die Axiome von Kolmogoroff legen formale Bedingungen fest, die an eine 
Wahrscheinlichkeitsdefinition zu stellen sind. Fragen der Konsistenz und 
der mathematischen Begründung dieser Axiome werden in den Büchern 
zur Maßtheorie und zur Wahrscheinlichkeitstheorie ausführlich behandelt. 
Auf eine Begründung der Axiome im Rahmen einer Theorie rationa- 
len Entscheidens (Entscheidungslogik) bei Ramsey und de Finetti (vgl. 
Stegmüller (1973), Teil 1.4) sei hier besonders hingewiesen. 




46 



• Die Axiome Kolmogoroffs legen fest, was „Wahrscheinlichkeit“ genannt 
werden darf. Aus ihnen läßt sich jedoch nicht ableiten, welches Wahr- 
scheinlichkeitsmaß in konkreten Problemstellungen verwendet werden 
soll. Mit den Wahrscheinlichkeitsbegriffen nach Laplace und nach v. Mises 
haben wir zwei Ansätze zur Festlegung eines solchen Maßes für bestimmte 
Situationen kennengelernt. Beide sind jedoch in der Literatur auch kriti- 
siert und durch andere Konzepte ersetzt, teilweise ersetzt oder zumindest 
ergänzt worden (vgl. z.B. Gnedenko (1970), Schnorr (1971)). 

Eine zentrale Stellung in diesem Zusammenhang nimmt die Diskussion um 
die Definition eines subjektiven Wahrscheinlichkeitsbegriffs ein, die u. a. 
auf Vorschläge von Ramsey, de Finetti und Savage zurückgeht (vgl. hierzu 
Savage (1972), Stegmüller (1973), Göttinger (1980), Dillmann (1990)). 
Bezüglich des verwendeten Wahrscheinlichkeitsbegriffs in diesem Buch 
wollen wir uns auf eine pragmatische Lösung zurückziehen: Je nach An- 
wendungsbeispiel werden wir sowohl objektive (im Sinne von Laplace oder 
v. Mises) als auch subjektive Interpretationen der Wahrscheinlichkeit be- 
nutzen. 

• Neben der Interpretation der Wahrscheinlichkeit, die ein wissenschafts- 
theoretisches Problem darstellt, bleibt ein praktisches Problem: die Be- 
rechnung der Wahrscheinlichkeiten. Bereits im Falle einer endlichen 
Grundgesamtheit und bei Vorliegen des Gleichmöglichkeitsmodells stellen 
sich dem Statistiker bei der numerischen Bestimmung der Wahrscheinlich- 
keiten umfangreiche kombinatorische Aufgaben (vgl. z.B. Ramb (1974)). 
Wir werden einige Male auf einfache kombinatorische Formeln zurück- 
greifen. Auf die Schwierigkeit der Lösung dieses Problems im Rahmen 
einer subjektiven Wahrscheinlichkeitsauffassung sei hier eigens hingewie- 
sen (vgl. Stegmüller (1973) und Göttinger (1974)). 

• Dem historisch interessierten Leser sei zur Geschichte der Wahrscheinlich- 
keitstheorie, aber auch der Statistik, Kennedy (1985) empfohlen. 

• Eine mehr technische Bemerkung zum Schluß: In der mathematischen 
Statistik nennt man (fi,S) einen Meßraum und (ß,S,W) einen Wahr- 
scheinlichkeitsraum. Ein Mengensystem S mit (Sl) und (S2) aber (S3) 
nur für endliche Folgen von Ereignissen nennt man eine Algebra oder 
einen Mengenkörper. Im Falle einer endlichen oder abzählbar unendlichen 
Grundgesamtheit (diskrete Grundgesamtheit) können wir S = P(fi) un- 
seren Überlegungen zugrunde legen. Maßtheoretische Überlegungen zei- 
gen, daß im Falle einer überabzählbaren (nicht diskreten) Grundgesamt- 
heit S = P(fi) in der Regel nicht gesetzt werden darf. Aus praktischen 
Gründen wird bei konkreten Problemstellungen oft auch bei diskreten 
Grundgesamtheiten eine kleinere Ereignisalgebra S als P (fi) betrachtet, 
z.B. S bestehend aus einem Ereignis A, dem Komplement Ä sowie dem 
sicheren Ereignis fi und dem unmöglichen Ereignis 0. (Zeigen Sie, daß S 
die Axiome (S1)-(S3) erfüllt.) 
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2.2 Eindimensionale Wahrscheinlichkeitsver- 
teilungen 

Zentral für diesen und die beiden folgenden Abschnitte ist der Begriff der Zu - 
fallsvariablen. Die Definition eines Zufallsexperimentes wurde im vorherge- 
henden Abschnitt bewußt weit gefaßt, um möglichst viele zufällige Vorgänge 
mit Hilfe der Wahrscheinlichkeitsrechnung behandeln zu können. Dies hat 
allerdings zur Folge, daß die im Ergebnisraum Q zusammengefaßten mögli- 
chen Ergebnisse von sehr verschiedenartiger Natur sein können: Augenzahlen 
beim Würfeln, Branchenzugehörigkeit von zufällig ausgewählten Industrie- 
unternehmen eines Wirtschaftsraumes usw. Auch interessiert man sich nicht 
immer für alle zunächst definierten Elementarereignisse, sondern nur für eine 
bestimmte Zerlegung von Q. Um eine einheitliche Behandlung all dieser Pro- 
blemstellungen zu ermöglichen, ist es sinnvoll, den einzelnen Elementarereig- 
nissen reelle Zahlen zuzuordnen: Im Falle quantitativer Merkmale geschieht 
dies einfach durch die Zuordnung der jeweiligen Merkmalsausprägungen zu 
jedem Elementarereignis, im Falle qualitativer Merkmale durch Zuordnung 
von Klassifikationszahlen. Handelt es sich um ein eindimensionales Merkmal, 
so entspricht aufgrund der gerade beschriebenen Zuordnung jedem Elemen- 
tarereignis genau eine reelle Zahl. Man definiert deshalb: 

Eine Abbildung X : Q — ► R, die jedem Elementarereignis u aus Q genau 
eine reelle Zahl iGR zuordnet, heißt eindimensionale Zufallsvariable. 

Betrachten wir die Eigenschaften einer eindimensionalen Zufallsvariab- 
len X etwas genauer: 

• Die Funktion X ist zunächst nur für Elementarereignisse definiert. Statt 
vom Elementarereignis u können wir nun von der Realisierung X(l>) = x 
sprechen. Ebenso lassen sich aber auch zusammengesetzte Ereignisse statt 
als Teilmengen von Q mit Hilfe von X als Teilmenge von R darstellen: So 
entspricht dem Ereignis „beim einmaligen Würfeln fällt eine Augenzahl 
die kleiner als vier ist“ die Menge {1, 2, 3} C R. (Sie haben sicher bereits 
bemerkt, daß wir in Abschnitt 2.1 den Begriff „Augenzahl x“ und die 
Zahl x nicht unterschieden haben; implizit haben wir dort also bereits 
vom Zufallsvariablenbegriff Gebrauch gemacht.) 

• Die Menge 

A(Q) = {# G R|# = X(<jj) für mindestens ein u> E Q} C R 

heißt Wertebereich von X oder Menge aller möglichen Realisierungen von 
X. Ist A(fi) endlich oder besteht A(Q) aus abzählbar unendlich vielen 
Werten, so heißt X diskrete Zufallsvariable; besteht der Wertebereich von 
X aus allen Zahlen eines bestimmten Intervalls von R, aus R selbst oder 
sogar aus einer Vereinigung von Intervallen von R, so heißt X stetige 
Zufallsvariable. (Eigentlich wäre hier der Begriff „kontinuierliche Zufalls- 
variable“ besser angebracht; eine neue, den Begriff „stetig“ motivierende 
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Charakterisierung der stetigen Zufallsvariablen mit Hilfe der Verteilungs- 
funktion werden wir im Verlauf dieses Abschnitts kennenlernen). 

• Betrachten wir das Zufallsexperiment „Ziehen einer statistischen Einheit 
aus einer Grundgesamtheit“. Wir interessieren uns dort für ein quantita- 
tives bzw. quantifizierbares eindimensionales Merkmal X, d.h. X ordnet 
der gezogenen statistischen Einheit die empirische Beobachtung x des 
Merkmals X, zu. In der gerade eingeführten Sprechweise: Jedes Merk- 
mal X läßt sich — betrachtet man eine Teilerhebung vor der konkre- 
ten Durchführung als Zufallsexperiment — als Zufallsvariable auffassen, 
und W{X = x) gibt die Wahrscheinlichkeit an, daß die gezogene statisti- 
sche Einheit gerade die Merkmalsausprägung x aufweist. Damit haben 
wir den Begriff „Chance“ aus 1.2 durch den Begriff „Wahrscheinlichkeit“ 
präzisiert. Auch wäre es nach dem eben gesagten genauer, von einer 
Wahrscheinlichkeitsauswahl statt einer Zufallsauswahl zu sprechen. Beide 
Begriffe werden aber in der Literatur nach wie vor synonym gebraucht. 
Ebenfalls synonym werden wir in der Folge die Begriffe „Merkmal“ und 
„die zu einem Merkmal zugehörige Zufallsvariable X“ gebrauchen, wenn 
aus dem Kontext klar hervorgeht, was gemeint ist. 

• Definiert man beim Würfelwurf X als Augenzahl, so gilt offensichtlich 
|ß| = |X(Q)|. Im allgemeinen gilt aber |X(fi)| < |fl|. Werden beispiels- 
weise aus einer Urne mit 10 Kugeln, die rot, grün oder gelb sind, zwei 
Kugeln durch Z.m.Z. ausgewählt, und ist X die Anzahl der ausgewählten 
roten Kugeln, so gilt offenbar |X(Q) | = 3 < 100 = |0|. 

• Sei A C ß ein beliebiges Ereignis. Die Zufallsvariable X, die den Wert 
1 annimmt, wenn das Ereignis A eintritt, und den Wert 0, wenn A nicht 
eintritt, heißt Indikatorvariable von A. Es gilt dann: W(X = 1) = W(A) 
und W(X = 0) = W(Ä) = 1 — W(A). Eine Zufallsvariable X, die genau 
zwei Werte annimmt, heißt dichotom. Steht eine dichotome Zufallsvariab- 
le (also ein Merkmal mit genau zwei Ausprägungen) im Mittelpunkt des 
Interesses statistischer Untersuchung, spricht man von einer sogenannten 
homograden Fragestellung; als heterograde Fragestellung bezeichnet man 
Untersuchungen von kardinalskalierten Merkmalen und den ihnen zuge- 
ordneten Zufallsvariablen. 

Will man Zufallsexperimente näher charakterisieren, d.h. will man Klarheit 
darüber erhalten, mit welcher Wahrscheinlichkeit verschiedene mögliche Er- 
eignisse als konkrete Ergebnisse eines Zufallsexperiments auftreten (z.B. die 
Wahrscheinlichkeit, daß beim einmaligen Werfen eines Würfels eine Zahl klei- 
ner oder gleich 2 erscheint), so liegt es nahe (analog zur Häufigkeitsverteilung 
in der deskriptiven Statistik), den Begriff der Wahrscheinlichkeitsverteilung 
einer (zum Zufallsexperiment gehörenden) Zufallsvariable einzuführen und 
nach Konzepten für ihre Beschreibung zu suchen: 
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Die Funktion F(x ), die jeder reellen Zahl x (E R die Wahrscheinlichkeit 

F{x) = W(X < x) 

zuordnet, daß die Zufallsvariable X einen Wert kleiner oder gleich x annimmt, 
heißt Verteilungsfunktion von X. Sie legt die Wahrscheinlichkeitsverteilung 
einer Zufallsvariablen vollständig fest. Der Wertebereich von X heißt Träger 
der Wahrscheinlichkeitsverteilung von X. 

Zur genaueren Beschreibung der Wahrscheinlichkeitsverteilung einer Zu- 
fallsvariablen X ist es sinnvoll, diskrete und stetige Zufallsvariablen getrennt 
zu behandeln: 

a) Im Falle einer diskreten Zufallsvariablen X heißt die Funktion /(x), die 
jeder reellen Zahl x die Wahrscheinlichkeit 

f(x) = W(X = x) 

zuordnet, daß X genau den Wert x annimmt, Wahrscheinlichkeitsfunk- 
tion von X. Da sich im diskreten Fall der Wertebereich von X in der 
Form xi, £2, £3, . . . angeben läßt, ist die Wahrscheinlichkeitsfunktion von 
der Gestalt 

*/ \ ( f(xi) x = Xi aus dem Wertebereich von X 

'<*> = 1 0 sonst 

Es gilt: 

/(*»') > 0 , Y^f(xi) = 1 , 

W(a < X <b)= £ f(xi) = F(b)-F(a). 

a<r,<6 

Die Verteilungsfunktion hat dann die Form 

F ( x ) = ü /(*<)• 

Xi<X 

Die graphische Darstellung der Wahrscheinlichkeitsfunktion ergibt somit 
ein Stabdiagramm , die der Verteilungsfunktion das Bild einer Treppen- 
funktion. Machen Sie sich die einzelnen Definitionen und Diagramme 
anhand des Beispiels „Einmaliger Würfel wurf 4 deutlich. 

b) Für eine stetige Zufallsvariable ist zu fordern, daß die zugehörige Vertei- 
lungsfunktion F(x) stetig ist. Auch ist es unmöglich, eine Summendar- 
stellung von F(x) zu erwarten. (Warum?) Man präzisiert die Definition 
einer stetigen Zufallsvariablen X in der folgenden Weise: 

X heißt stetig, falls eine nicht-negative reellwertige Funktion f(x) exi- 
stiert, so daß für jede reelle Zahl a gilt: 

F(a) = W(X < a) = f f(x)dx. 

J —00 

Die Funktion f(x) heißt Dichtefunktion (Dichte) von X. Es gilt: 
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• f(x) > 0, aber nicht notwendigerweise f(x) < 1. 

• W(a < X < b) = dx = F(b) - F(a). 

• W(X = a) = 0 für jedes a E R, also 

W(a <X<b) = W(a < X < b) = W{a < X < b) = W(a < X < 6), 

was für diskrete Zufallsvariablen im allgemeinen nicht gilt. 

• F'(x) = /(#), falls f(x) in x stetig ist. 

• Graphisch ergibt sich die Wahrscheinlichkeit, daß die stetige Zufalls- 
variable X Werte zwischen a und b annimmt, als die Fläche zwischen 
Dichtefunktion und Abszisse innerhalb der Grenzen X — a und X — b 
(Abbildung 2.1). 




Abbildung 2.1: Dichtefunktion; W(l < X < 3) 



Aufgabe 2.2/1 

a) Welche Eigenschaften besitzt die Verteilungsfunktion einer Zufallsvariab- 
len X? 

b) „Eine Zufallsvariable ist eine Funktion, die reelle Zahlenwerte mit be- 
stimmten Wahrscheinlichkeiten annimmt.“ Nehmen Sie Stellung. 



Aufgabe 2.2/2 Betrachten Sie das Zufallsexperiment „Zweimaliges Werfen 
eines idealen Würfels“. Definieren Sie eine geeignete Zufallsvariable, wenn 
das Merkmal „Summe der Augenzahlen“ interessiert; stellen Sie ihre Wahr- 
scheinlichkeitsfunktion sowie Verteilungsfunktion graphisch dar. 




51 



Aufgabe 2.2/3 Die Dichtefunktion einer stetigen Zufallsvariablen X sei ge- 
geben durch 

{ x für 0 < x < 1 

—x + 2 für 1 < x < 2 
0 sonst 

a) Berechnen Sie (0.5 < x < 2). 

b) Berechnen Sie F(1.5). 

c) Berechnen Sie a so, daß W(X < a) = 0.8. 

d) Bestimmen Sie die Verteilungsfunktion von X. 



Aufgabe 2.2/4 Welche der folgenden Funktionen ist nicht Dichtefunktion 
einer stetigen Zufallsvariablen X ? 



/i(*) = { 

/2O0 = | 
fs( x ) - { 



2x für 0 < x < 2 
0 sonst 

§z für 0 < x < 2 
0 sonst 

x + 1 -l<x<0 

— x-fl 0<ar<l 
0 sonst 



Aufgabe 2.2/5 Ein Wirtschaftsforschungsinstitut hält für die Inflationsrate 
alle Werte im Intervall 4 < Y < 6 für prinzipiell möglich und unterstellt für 
ihre Prognose die folgende Dichtefunktion: 




4 < y < 6 
sonst 



Berechnen Sie die Wahrscheinlichkeit, daß die Inflationsrate zwischen 5 und 
6 liegt. 



Ergänzungen und Bemerkungen 

• Die oben gegebene Definition einer Zufallsvariablen X ist für die von 
uns zu betrachtenden Anwendungen zwar ausreichend, aber mathema- 
tisch nicht ganz vollständig. Um ein ursprünglich auf Q definiertes Wahr- 
scheinlichkeitsmaß auf R übertragen zu können, muß folgende Zusatzbe- 
dingung erfüllt sein: X~ l (— 00 , 2 ?] E S für alle x E R, d.h. die Mengen 
{u\X(u) < x } müssen für alle reellen Zahlen x E R Ereignisse sein. Dies 
erst garantiert die Übertragbarkeit des ursprünglich auf (fi, S) definierten 
Wahrscheinlichkeitsmaßes W auf den neuen Meßraum (R,B), wobei B die 
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sogenannte Borel-Algebra ist: die von allen Intervallen der Form (— 00 , x] 
erzeugte er- Algebra auf R, die alle Intervalle aus R enthält. Ist I ein 
beliebiges Intervall aus diesem Mengensystem, so garantiert die formu- 
lierte Zusatzbedingung, daß W vermöge W(I) = W({w E fi|X(u;) E /}) 
von (fi, S) in eindeutiger Weise auf (R, B) übertragen wird. (Vgl. hierzu 
Bücher zur Maßtheorie oder Wahrscheinlichkeitstheorie wie z.B. Henze 
(1971)). 

• Die Einteilung der Zufallsvariablen in diskrete und stetige ist nicht 
erschöpfend. So lassen sich sogenannte gemischte Zufallsvariablen defi- 
nieren, bei denen X sowohl einen diskreten als auch einen stetigen Teil 
besitzt. 

• Die Verteilung einer Zufallsvariablen X heißt symmetrisch zum Punkt 
xo , wenn für die Wahrscheinlichkeitsfunktion bzw. für die Dichte gilt: 
f(x 0 + c) = f(xo - c) für alle c. 



2.3 Mehrdimensionale Wahrscheinlichkeits- 
verteilungen 

Werden im Rahmen einer statistischen Untersuchung gleichzeitig mehrere, 
sagen wir m, eindimensionale Merkmale erhoben, so läßt sich jeder statisti- 
schen Einheit bezüglich jedem Merkmal je eine Merkmalsausprägung zuord- 
nen. Wird nun — wie im vorangehenden Abschnitt beschrieben — jedes 
Merkmal durch eine Zufallsvariable Xi beschrieben, so erhalten wir eine m- 
dimensionale Zufallsvariable 



X = (X \, . . . ,X m ) : 



D — ► R m 

w ►-+ (X 1 (w),...,A m (w)). 



Die Verteilungsfunktion F(x ), die jedem x = (a?i, . . .,x m ) E R m die Wahr- 
scheinlichkeit 

W(X 1 <z 1 ,...,X m <z m ) = F(z) 



(die Wahrscheinlichkeit also, daß X\ Werte höchstens gleich x\ und . . .und 
X m Werte höchstens gleich x m annimmt) zuordnet, heißt gemeinsame Ver- 
teilungsfunktion der Zufallsvariablen X = (Xi, . . . , X m ). 

Für die weiteren Ausführungen ist es wieder sinnvoll, diskrete und ste- 
tige Zufallsvariablen zu unterscheiden; außerdem sollen die sich im Unter- 
schied zur eindimensionalen Zufallsvariablen neu ergebenden Fragestellungen 
und Definitionen aus Ubersichtlichkeitsgründen am Beispiel zweier Merkmale 
(X,Y) demonstriert werden. Die Verallgemeinerung der folgenden Resultate 
und Definitionen von m = 2 auf mehrdimensionale Zufallsvariablen beliebiger 
Dimension sollte Ihnen keine Schwierigkeiten bereiten. 
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a) Eine zweidimensionale Zufallsvariable ( X,Y ) heißt diskret , wenn sie nur 
endlich viele oder abzahlbar unendlich viele Werte annimmt. Der Wer- 
tebereich von (X, Y) besteht also aus Paaren (xi,y ; ); % — l,...,fc, j = 
1,...,/, bzw. i,j E N. Die Funktion f{x,y), die jedem (x,y) E R die 
Wahrscheinlichkeit W(X = x, Y = y) zuordnet, heißt gemeinsame Wahr - 
scheinlichkeitsfunktion von X und Y : 

= yj) falls (x,y) = (xi,yj) 
nx,y) - \ 0 sonst 

Ist der Wertebereich endlich, gilt also i = 1, . . . , k und j = 1, . . . , /, so 
läßt sich / übersichtlich in einer Tabelle ( Kontingenztabelle , k x l-Felder- 
Tafet) oder durch ein Stabdiagramm über der x-y-Ebene darstellen. Die 
Verteilungsfunktion F(x,y) ist dann von der Form 

F{x,y) = Y, Y /(*<>«»)• 

x t <x yj<y 

Definiert man fx(xi) = XZj /(«,*, yj), so ist offensichtlich fx(xi) = 
W(X = x,). Die durch diese Wahrscheinlichkeitsfunktion für alle x, de- 
finierte Verteilung nennt man die Randverteilung von X. Entsprechend 
wird durch fy(yj) = f( x iiVj) die Randverteilung von Y definiert. Ne- 
ben der gemeinsamen Wahrscheinlichkeitsverteilung und den zwei Rand- 
verteilungen lassen sich im Falle einer zweidimensionalen Zufallsvariablen 
(X, Y) durch 

f(xi\ yj ) = W(X = Xi\Y = yj) = 
f(Vi\*i) = W ( Y = Vi\ X = *<) = 

für jedes y ; bzw. x, weitere Wahrscheinlichkeitsfunktionen definieren: die 
bedingten Wahrscheinlichkeitsfunktionen von X bzw. Y. 

Analog dem Unabhängigkeitsbegriff für Ereignisse definiert man: Zwei 
Zufallsvariablen X und Y heißen unabhängig , wenn gilt: 

/(**,%) = fx(xi) fy{yj) für alle ij. 

Die Frage nach der Unabhängigkeit ist eine zentrale Fragestellung in stati- 
stischen Untersuchungen von mehrdimensionalen Zufallsvariablen (Merk- 
malen). 

b) Eine zweidimensionale Zufallsvariable (X, Y) heißt stetig , wenn die ge- 
meinsame Verteilungsfunktion F(x,y) in beiden Variablen stetig ist. In 
diesem Fall existiert eine nicht-negative Funktion /(x, y), so daß die Ver- 
teilungsfunktion die Gestalt hat: 




/(x,y) dy dx. 
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f(x,y) heißt gemeinsame Dichtefunktion (bzw. gemeinsame Dichte) von 
X, Y. Die Randverteilung von X bzw. Y ist definiert durch die jeweilige 
Dichtefunktion 



[OO 

fx{x) = / f(x,y)dy für alle x 
J — OO 

[OO 

}y(v) = / f( x , y) dx für alle y. 

J —OO 

Die bedingten Verteilungen sowie die Unabhängigkeit sind im stetigen 
Fall analog zum diskreten Fall definiert. Dabei sind Summationen über 
den diskreten Wertebereich durch Integrationen über den kontinuierlichen 
Wertebereich zu ersetzen. 



Aufgabe 2.3/1 

a) Definieren Sie Unabhängigkeit zweier Zufallsvariablen X und Y mit Hilfe 
der bedingten Wahrscheinlichkeitsfunktion (bzw. Dichte) sowie der jewei- 
ligen Randverteilung. 

b) Eine Urne enthalte 10 Kugeln: 4 weiße und 6 schwarze Kugeln. Sie ziehen 
zwei Kugeln nacheinander aus der Urne. Definieren Sie für i = 1,2: 

X __ f 0 im i-ten Zug erhält man eine schwarze Kugel 
* ~~ ^ 1 im i-ten Zug erhält man eine weiße Kugel 

Zeigen Sie: Im Falle von Ziehen mit Zurücklegen (Z.m.Z.) sind X\ und 
X 2 unabhängig; im Falle von Ziehen ohne Zurücklegen (Z.o.Z.) abhängig. 



Aufgabe 2.3/2 Die gemeinsame Wahrscheinlichkeitsfunktion der zweidi- 
mensionalen Zufallsvariablen (X, Y) sei gegeben durch folgende Tabelle: 





1 


2 


3 


4 


-2 


0.2 


0.1 


0 


0.1 


0 


0.3 


0 


0.1 


0 


2 


0 


0.1 


0.1 


0 



a) Bestimmen Sie die Randverteilungen, die Verteilungsfunktion sowie die 
bedingten Verteilungen von (X, Y). 

b) Berechnen Sie 

W(X > 0 , Y < 3), W(X > 2,7 < 4), W(X > -3, Y < 4). 



c) Sind X, Y unabhängig? 
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Aufgabe 2.3/3 Eine Urne enthalte 5 weiße, 2 schwarze und 3 blaue Kugeln. 
Man ziehe zweimal mit Zurücklegen. Erstellen Sie die gemeinsame Wahr- 
scheinlichkeitsfunktion für die Zufallsvariable (X, Y), wobei X=„ Anzahl der 
weißen Kugeln in der Stichprobe“ und Y = „Anzahl der schwarzen Kugeln 
in der Stichprobe“ bedeutet. 



Aufgabe 2.3/4 Diskutieren Sie folgende Aussagen: 

• „Die Randverteilungen enthalten bereits alle Informationen über die ge- 
meinsame Wahrscheinlichkeitsfunktion“ . 

• „Zweidimensionale Zufallsvariablen sind entweder diskret oder stetig“. 

Ergänzungen und Bemerkungen 

• Eine mehrdimensionale Zufallsvariable läßt sich als ein Zufallsvektor auf- 
fassen, dessen Komponenten eindimensionale Zufalls variablen sind. 

• Betrachtet man die einzelnen Komponenten einer mehrdimensionalen Zu- 
fallsvariablen als von der Zeit abhängige Variablen, so nennt man Xt = 
(ß, S, W, (X t )t£T) einen stochastischen Prozeß . Dabei kann ( X t ) sowohl 
eine endliche , abzählbar unendliche oder überabzählbare Menge von Zu- 
fallsvariablen sein. Grundlegende Definitionen der Theorie stochastischer 
Prozesse findet man in Fisz (1976), Kapitel 8 oder Breiman (1969). 



2.4 Maßzahlen einer Wahrscheinlichkeitsver- 
teilung 

Neben der expliziten Angabe der Wahrscheinlichkeitsfunktion oder der Ver- 
teilungsfunktion sowie deren graphischen Darstellungen läßt sich die Wahr- 
scheinlichkeitsverteilung einer Zufallsvariablen X auch durch sogenannte 
Maßzahlen (Parameter der Verteilung) charakterisieren (vgl. Abschnitt 1.3). 

a) Sei X eine eindimensionale Zufalls variable. Dann wird durch 



ß = E(X) = 



f(xi ) X ist diskret 
J ^ x f(x) dx X ist stetig 



ein die Lage der Verteilung von X kennzeichnender Parameter festgelegt: 
der Erwartungswert von X. Allgemeiner: Ist g eine auf R definierte reell- 
wertige Funktion, so wird durch g(X) eine neue Zufallsvariable definiert, 
nämlich die Zufallsvariable ß 9 u> g(X(u )), deren Realisation gerade 
g(x) ist, wenn x die Realisation von X ist. Existieren 



E(g(X)) = Y^g(xi)f(xi) bzw. 




g(x)f(x)dx, 
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so nennt man diese den Erwartungswert der Zufallsvariablen g(X). Es 
gilt 

E(gi(X) + g 2 (X)) = E(g 1 (X)) + E(g 2 (X)). 

Ist g eine lineare Funktion von X, also g(X) = aX + b, so erhält man 
E(aX +b) = aE(X) + b. 

b) Die wichtigste Maßzahl der Streuung für eine eindimensionale Zufallsva- 
riable X ist die Varianz 



ff2 _ y _ I E;( x «' - E(X)) 2 f(xi) X ist diskret 
\ f^°oo( x ~ E(X)) 2 f( x ) dx X ist stetig 

<r = ST(X) = y/ V(X ) heißt die Standardabweichung von X. Es gilt 

V(aX + b) = a 2 V(X) 

V(X)~. E(X 2 ) - [E(X)] 2 . 

c) Sei (X, Y) eine zweidimensionale Zufallsvariable und g(x , y) eine reellwer- 
tige Funktion in zwei Variablen. Dann heißt 



E(g(X,Y)) 



E« Ej 9(xi > Vj )/(*.• . Vj ) (X, Y ) diskret 

f-oo /-~ 9(x, v)f(x, y) dx dy ( X , y) stetig 



der Erwartungswert der Zufallsvariablen g(X , Y) (falls die entsprechenden 
Summen bzw. Integrale existieren). Folgende Regeln lassen sich ableiten: 

• 2*(E£i*0 = ET=i*TO 

• £(nr =1 Xi) = nr = i E (Xi), falls X lt ...,X m unabhängig 

• V(E£i X ') = E.”i V(Xi), falls X u ...,X m unabhängig. 

Sind X, Y abhängige Zufallsvariablen, so interessieren nähere Aufschlüsse 
über Art und Stärke der Abhängigkeit. Dazu definiert man zunächst die 
Kovarianz zweier Zufallsvariabler X, Y durch 

c TXY = Cov(X, Y) = E(X • Y) - E(X) • E(Y). 

Aus den obigen Regeln läßt sich sofort ableiten: 

X, y unabhängig => Cov(X, y) = 0. 

Einfache Gegenbeispiele zeigen, daß die Umkehrung dieser Folgerung i. a. 
nicht gilt. Ist z.B. ü?(X) = E(X 3 ) = 0 (X ist symmetrisch verteilt) und 
y = X 2 , so ist offensichtlich Cov(X, Y) = 0, aber Y ist perfekt von X 
abhängig. Nennt man X, Y unkorreliert , wenn Cov(X, Y) = 0 gilt, so 
heißt dies: Die Unkorreliertheit ist eine schwächere Bedingung an zwei 
Zufallsvariäblen als die Unabhängigkeit. Weiter gilt: 
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. Cov(X, Y) = E{[X - E(X)][Y - £(y)]} 

• Cov(X, y) ^ 0 => X, Y sind abhängig 

• Cov(A'. }') > 0 => X, Y variieren gleichläufig 

• Cov(A', y)<0=^A:,y variieren gegenläufig 

• v (x + y ) = y (x) + v(Y) + 2Cov(x, y ) 

• v(z?=i Xi) = nxi) + m*,- cov^-.x,-). 

Während die Kovarianz also bereits Aufschluß über das Vorliegen und 
die Art der Abhängigkeit zweier Zufallsvariablen X } Y gibt, läßt sich Auf- 
schluß über die Stärke des Zusammenhangs (genau: des linearen Zusam- 
menhangs) mit Hilfe des aus der deskriptiven Statistik bekannten Korre- 
lationskoeffizienten R (nach Bravais/ Pearson) gewinnen: 



R(X,Y) 



Co v(X,Y) 
V V (X)V(Y)' 



Er ist definiert, falls = V(X) ^ 0 und a\ = V(Y) / 0, also X und Y 
„echte“ Zufalls variablen sind. Es gilt: 

• -1 < R(X,Y) < +1 

• R(X, Y) < 0 O Cov(A, Y)<0=>X,Y variieren gegenläufig 

• R(X , Y) > 0 O Cov(X, Y) > 0 => X, Y variieren gleichläufig 

• \R(X ) Y)\ = 1 es besteht eine lineare Relation zwischen X und Y 
(für fast alle Werte im Falle stetiger Zufallsvariablen), nämlich 

Y = cx + ßX mit a = E(Y) - ßE(X), ß = R{X, Y)y/V{Y)/V(X). 

Mit Hilfe der jeweiligen Randverteilungen lassen sich im Falle der zweidi- 
mensionalen Zufallsvariablen (X,Y) analog zu a) und b) Maßzahlen für 
die eindimensionalen Zufallsvariablen X und Y ableiten und bestimmen. 
Ferner bezeichnet man die Erwartungswerte der bedingten Verteilungen 
als bedingte Erwartungswerte . Exemplarisch sei hier im diskreten Fall der 
bedingte Erwartungswert von X gegeben Y = yj aufgeführt: 



k 

E(X\Y = y j ) = Y f *if(x i \Vi )• 

i= 1 



Aufgabe 2.4/1 

a) Berechnen Sie Erwartungswert und Varianz der in Aufgabe 2.2/2 beschrie- 
benen Zufalls variablen. Läßt sich der Erwartungswert hier ohne Rechnung 
ermitteln? 
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b) Berechnen Sie Erwartungswert und Varianz der in Aufgabe 2.2/3 beschrie- 
benen Zufallsvariablen. 



Aufgabe 2.4/2 Erläutern Sie folgende Aussagen: 

• Die Kovarianz gibt Aufschluß über das Vorliegen und die Art der Ab- 
hängigkeit zweier Zufallsvariablen X,Y\ nicht aber über die Stärke des 
Zusammenhangs . 

• Der Korrelationskoeffizient ist ein Maß für die Stärke des Zusammenhangs 
zweier Zufallsvariablen. 

• Die Unkorreliertheit ist eine schwächere Bedingung an zwei Zufallsvari- 
ablen als die Unabhängigkeit. 



Aufgabe 2.4/3 Wir betrachten die in Aufgabe 2.3/2 gegebene zweidimen- 
sionale Zufallsvariable (X, Y). 

a) Berechnen Sie den Erwartungswert der Zufallsvariablen X bzw. Y. 

b) Berechnen Sie den Erwartungswert der Zufallsvariablen g(X y Y) = XY . 

c) Lassen sich aus den Ergebnissen zu a) und b) Aussagen über Unabhängige 
keit/ Abhängigkeit der Zufallsvariablen X, Y ab leiten? 

d) Berechnen Sie E(X\Y = 1). 



Aufgabe 2.4/4 Ein mit der Prognose von Wachstumsrate (X) und Infla- 
tionsrate (Y) der bundesdeutschen Wirtschaft beauftragtes Wirtschaftsfor- 
schungsinstitut hält für 1995 die Wachstumsraten -1,0 und -hl sowie die In- 
flationsraten 4% und 5% für möglich. Aufgrund einer eingehenden Analyse 
der weltwirtschaftlichen Lage werden folgende Wahrscheinlichkeiten errech- 
net: 



aN? 


4 


5 


-1 


0.1 


0.5 


0 


0.1 


0.2 


1 


0 


0.1 



a) Berechnen Sie E(X) und E(Y). 

b) Wie groß ist die Wahrscheinlichkeit für eine Wachstumsrate von -1, wenn 
eine Inflationsrate von 5% aufgrund neuerer Erkenntnisse bereits als sicher 
angenommen werden kann? 

c) Überprüfen Sie, ob X und Y unabhängige Zufallsvariablen sind. 

d) Überprüfen Sie, ob X und Y unkorrelierte Zufallsvariablen sind. 
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Ergänzungen und Bemerkungen 

• Betrachtet man als Zufallsexperiment das Ziehen einer statistischen Ein- 
heit und ist X die einem eindimensionalen Merkmal zugeordnete Zufalls- 
variable, so wählt man in der Regel die folgende Bezeichnungsweise: 

- E(X) = px = /i („Mittelwert der Grundgesamtheit“) 

- V(X) = cr 2 x = er 2 („Grundgesamtheitsvarianz“) 

- ST(X) = (Tx = & („Standardabweichung der Grundgesamtheit“). 

Entsprechend nennt man die Verteilung von X Grundgesamtheitsvertei- 
lung. Bei Vorliegen einer zweidimensionalen Zufallsvariablen (X\^X 2 ) 
wählt man die folgende Bezeichnungsweise: 

- Cov(Xi,X 2 ) = vx u x 2 — ^12 („Kovarianz der Grundgesamtheit“) 

— R(X 1 ^X 2 ) = ß(Xi,X 2 ) = Q („ Korrelat ionskoefRzient der Grundge- 
samtheit“). 

Es gilt: V(Xi) = Co y(Xi,Xi) = au = 

• Existiert für eine positive ganze Zahl k und eine Zahl c der Erwartungs- 
wert JE7{(^ — c) fc } , so nennt man diesen Wert k-tes Moment um c (Moment 
fc-ter Ordnung um c) der Zufallsvariablen X. Von besonderer Bedeu- 
tung für die Charakterisierung von Verteilungen sind die fc-ten Momente 
um 0, E(X k ), sowie die k- ten Momente um E(X) (zentrale Momente), 
E{(X — E(X)) k }. So ist das erste Moment um 0 genau der Erwar- 
tungswert, das 2. zentrale Moment die Varianz von X. Die Kenntnis 
zusätzlicher Momente charakterisiert die Verteilung von X immer besser. 
Wir werden sehen, daß bei Vorgabe eines gezielten Verteilungstyps einer 
Zufallsvariablen oft bereits die Kenntnis weniger Momente zur eindeu- 
tigen Festlegung der Wahrscheinlichkeitsverteilung ausreicht (parametri- 
sche Klasse von Verteilungen). Im allgemeinen kann man dies aber nicht 
erwarten. 

• Nimmt eine Zufallsvariable X nur nicht-negative Werte an und besitzt 
sie einen endlichen Erwartungswert E(X ), so gilt für jede positive Zahl 
k : W(X > k) < E(X)/k (vgl. Fisz (1976), 98-100). Daraus folgt die 
sogenannte Tschebyscheffsche Ungleichung: W(\X-E(X)\ > ka) < 1/fc 2 , 
die die Bedeutung der Standardabweichung und damit der Varianz als 
Kennzahl für die Streuung einer Verteilung hervorhebt. 

• Ist (Xi,...,X m ) eine m-dimensionale Zufallsvariable, so faßt man die 
verschiedenen Varianzen und Kovarianzen der Grundgesamtheit in der 
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sogenannten Varianz-Kovarianz-Matrix zusammen: 

<r\ 0-12 

<r 2 j a\ 

^ml & m 2 

Die Varianz-Kovarianzmatrix ist Ausgangspunkt vieler multivariater Ver- 
fahren und spielt eine wichtige Rolle bei der ökonometrischen Modellbil- 
dung. 

2.5 Binomialverteilungen 

Wir betrachten ein Zufallsexperiment, das sich unter gleichen Bedingungen 
ra-mal wiederholen läßt. Dabei setzen wir voraus, daß sich die einzelnen 
Durchführungen des Zufallsexperiments, die wir Versuche nennen wollen, 
nicht gegenseitig beeinflussen. Weiter soll bei jedem einzelnen Versuch nur 
interessieren, ob ein bestimmtes Ereignis A eintritt oder nicht. Beispiele 
hierfür sind: 

• Eine Münze wird 10-mal geworfen, und wir interessieren uns bei jedem 
Münz wurf dafür, ob „Zahl“ fällt oder nicht. 

• Ein Würfel wird 20-mal geworfen, und unser Interesse gilt bei jedem Wurf 
dem Ereignis A=„ungerade Zahl fällt“={l, 3, 5}. 

• Aus einer Urne mit 10 Kugeln, von denen 3 rot sind, wird eine Stichpro- 
be vom Umfang n durch Ziehen mit Zurücklegen gewonnen. Jede in die 
Stichprobe gelangte Kugel wird daraufhin untersucht, ob sie rot ist oder 
nicht. Man interessiert sich für die Zahl der gezogenen roten Kugeln. 

Die beschriebenen Zufallsexperimente lassen sich exakt wie folgt charakteri- 
sieren: 

• Ein Zufallsexperiment, dem ein endlicher oder unendlicher Ergebnisraum 
Q zugrundeliegt, wird n-mal wiederholt ( n ist eine feste natürliche Zahl, 
also insbesondere endlich). 

• Bei jeder Durchführung des Zufallsexperiments, bei jedem Versuch also, 
interessiert nur, ob ein bestimmtes Ereignis A eintritt oder nicht. Jeder 
Versuch läßt sich also durch die folgenden dichotomen Zufallsvariablen 
beschreiben: 

Y _ ( 1 A tritt im z-ten Versuch ein c — \ \ 

1 — ^ 0 A tritt im z-ten Versuch nicht ein ^ ~ > • • • > n J- 

• Die Versuche beeinflussen sich gegenseitig nicht, d.h. die Zufallsvariablen 
Xi (z = 1, . . . , n) sind unabhängig. 
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• Die Wahrscheinlichkeit, daß in einem Versuch A eintritt, sei bekannt und 
damit konstant für alle Versuche (da Unabhängigkeit vorliegt): 

W(A) = W(Xi = 1) = Tr, i = 1, . . . , n. 

Ist man nun an der Wahrscheinlichkeit interessiert, daß das Ereignis A bei 
n Versuchen genau x-mal eintritt (a: = 0,1,..., n), so kann man diese Frage- 
stellung wie folgt präzisieren: Gesucht ist die Wahrscheinlichkeitsverteilung 
der Zufallsvariablen 

x = ±x, 

i=l 

Kombinatorische Überlegungen ergeben 

/ ("^(I-tt)"-* für x = 0,...,n 
/b« = ( soml 

als Wahrscheinlichkeitsfunktion der Zufallsvariablen X. 

Die durch diese Wahrscheinlichkeitsfunktion definierte Verteilung heißt 
Binomialverteilung mit den Parametern n und i r. Eine (diskrete) Zufalls- 
variable X mit dieser Wahrscheinlichkeitsfunktion heißt binomialverteilt mit 
den Parametern n und 7 r, und wir schreiben dafür: 

X - BV(n, tt). 

Für den Erwartungswert und die Varianz einer binomialverteilten Zufallsva- 
riablen X ~ BV(n , 7 r) errechnet man: 

E{X) = n7T und V(X) — mr(l — 7 r). 

Als Verteilungsfunktion erhält man schließlich 

fbm = { p « ( " ) '' (1 - 10 ^ l 

l 0 für xo < 0. 

Bei xo > 0 ist über alle nicht-negativen ganzen Zahlen x, die nicht größer als 
xo sind und im Wertebereich von X (d.h. x < n) liegen, zu summieren. 

Aufgabe 2.5/1 Welche der folgenden Fragestellungen lassen sich durch An- 
wendung der Binomialverteilung beantworten? Berechnen Sie die mit Hilfe 
der Binomialverteilung bestimmbaren Wahrscheinlichkeiten. 

a) Wie groß ist die Wahrscheinlichkeit, beim 10-maligen Werfen eines 
Würfels genau viermal eine „6“ zu würfeln? 

b) Wie groß ist die Wahrscheinlichkeit, beim Zahlenlotto in einer Ziehung 
genau drei Richtige zu haben? 




62 



c) In Ihrer Heimatstadt kennen Sie jeden 10. Einwohner persönlich. Wie 
groß ist die Wahrscheinlichkeit dafür, daß Sie auf dem Heimweg von Ihrer 
Stammkneipe keinen Bekannten trafen, wenn Sie sich daran erinnern, daß 
Ihnen 10 einzelne Personen begegneten? 

d) Wie in c), aber diesmal sind Sie sicher, daß Sie nur eine Gruppe von 10 
Personen trafen. 

e) Aus einer Urne mit 100 Kugeln werden 5 Kugeln gezogen. Wie groß ist 
die Wahrscheinlichkeit dafür, daß darunter keine rote Kugel ist, wenn in 
der Urne selbst 10 rote Kugeln sind und die Stichprobe 

• durch Ziehen mit Zurücklegen (Z.m.Z.) 

• durch Ziehen ohne Zurücklegen (Z.o.Z.) 

• durch Ziehen von 5 Kugeln auf einen Schlag 
gewonnen wurde? 



Aufgabe 2.5/2 Nach der Gliederung der amtlichen Berufssystematik ge- 
hörten bei der Bundestagswahl 1990 2340 von 3696 Kandidaten dem Bereich 
„Dienstleistungsberufe“ an. Davon waren 390 Lehrer. 894 Kandidaten waren 
Frauen (Das Parlament 23. 11. 1990, S. 2). Wie groß ist die Wahrscheinlich- 
keit, daß von 100 Kandidaten, die durch Z.m.Z. ausgewählt wurden, mehr 
als 20 

a) „Dienstleistungsberufen“ angehören, 

b) Lehrer sind, 

c) Frauen sind? 



Aufgabe 2.5/3 In einem Regierungsbezirk sind 70% der Einwohner gegen, 
30% für den Bau einer Deponie für Sondermüll in ihrer Region. Auf der 
Durchreise durch dieses Gebiet befragen Sie 8 verschiedene Einwohner zu 
diesem Problem. 

a) Stellen Sie die möglichen Ergebnisse in einer Tabelle dar. 

b) Interpretieren Sie das wahrscheinlichste und das am wenigsten wahr- 
scheinliche Ergebnis. 



Ergänzungen und Bemerkungen 

• Die Binomialverteilung wird auch Bernoulli-Verteilung nach Jacob Ber- 
noulli (1654-1705) genannt, der sich erstmals intensiv mit Zufallsexpe- 
rimenten der in diesem Abschnitt beschriebenen Art beschäftigte. In 
diesem Zusammenhang spricht man deshalb auch oft von Bernoulli- 
Experimenten oder von einer Bernoullischen Versuchsanordnung . 
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• Die Ergebnisse eines Zufallsexperiments der betrachteten Art lassen sich 
offensichtlich darstellen durch n-Tupel (xi,...,x n ), wobei x, = 0 oder 
Xi = 1 für i = gilt. Beachten Sie, daß die Realisation x der 

Zufallsvariablen X = bis au ^ die Anordnung (Reihenfolge) der 

Zahlen 0 und 1 die Ergebnisse des Zufallsexperiments vollständig charak- 
terisiert und alle n-Tupel gleichmöglich sind (Laplace- Annahme). 



2.6 Negative Binomialverteilungen 

Wir betrachten die gleiche Versuchsanordnung wie in 2.5, legen aber die Zahl 
n der Wiederholungen nicht fest. Vielmehr soll das Experiment so lange 
wiederholt werden, bis genau fc-mal das Ereignis A beobachtet wurde. Mit 
X bezeichnen wir die Zufallsvariable, deren Realisation gerade diese Anzahl 
der Wiederholungen ist. Für die Wahrscheinlichkeitsfunktion ergibt sich 

“ n) x ~ k für x = fc, k + 1, . . . 

0 sonst 

Eine (diskrete) Zufallsvariable X (mit abzählbar unendlich vielen Ausprägun- 
gen) mit dieser Wahrscheinlichkeitsfunktion heißt negativ binomialverteilt mit 
den Parametern k und 7r: 



/atb(z) = 



X~NBV(k,*). 

Gilt speziell k = 1, so spricht man von der geometrischen Verteilung. 

Aufgabe 2.6/1 In einer großen Arbeitsstätte mit einem Frauenanteil von 
20% unter den Beschäftigten soll eine Beschäftigtenstichprobe durch Z.m.Z. 
gezogen werden. Die Stichprobenziehung soll beendet werden, wenn 2 Frauen 
in der Stichprobe sind. Wie groß ist die Wahrscheinlichkeit, daß die Stich- 
probe genau 8 Personen umfaßt? 



Aufgabe 2.6/2 Wie groß ist die Wahrscheinlichkeit, daß beim 5. Wurf 
zweier idealer Würfel zum zweiten Mal die Summe der Augenzahlen 5 
beträgt? 



Ergänzungen und Bemerkungen 






Setzt man x = r+ k ) so läßt sich die Wahrscheinlichkeitsfunktion schreiben 
als 



f(r + 




( r t-lV(i-») r 

0 



r = 0, 1, . . . 
sonst 



Man spricht deshalb auch von einer negativen Binomialverteilung der Ord- 
nung k % Andere Bezeichnung: Pascal- Verteilung. 
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• Der Name der Verteilung rührt daher, daß die Terme der Taylorschen 
Reihenentwicklung von w~ k = [1 — (1 — tt)] - * nach (1 — w) multipliziert 
mit ir k mit den Werten der Wahrscheinlichkeitsfunktion übereinstimmen. 

2.7 Hypergeometrische Verteilungen 

Ein wichtiges Beispiel für die Anwendung der Binomialverteilung ist das Zie- 
hen einer Stichprobe vom (festen) Umfang n aus einer beliebigen Grund- 
gesamtheit. Dabei muß unterstellt werden, daß die Stichprobe durch Zie- 
hen mit Zurücklegen gewonnen wird und jeder in die Stichprobe gelangte 
Merkmalsträger nur daraufhin untersucht wird, ob eine bestimmte Merk- 
malsausprägung (Eigenschaft) A vorliegt oder nicht. 

Wir wollen nun den Fall behandeln, daß aus einer Grundgesamtheit eine 
Stichprobe vom Umfang n durch Ziehen ohne Zurücklegen entnommen wird. 
Dabei setzen wir voraus, daß die betrachtete Grundgesamtheit endlich ist, 
also N Elemente enthält. Jedes Element in der Stichprobe soll nur auf 
das Vorliegen einer bestimmten Eigenschaft A untersucht werden. Beispiele 
hierfür finden sich in der Qualitätskontrolle (Endabnahme) bei Fertigungs- 
prozessen (aus der Tagesproduktion von N Teilen werden n ausgewählt und 
auf Funktionstüchtigkeit geprüft) oder in der Wareneingangskontrolle (An- 
nahmekontrolle) von Betrieben (aus einer Lieferung von 100000 Schrauben 
werden 100 entnommen und auf Ausschußstücke hin überprüft). 

Die Klasse von Problemstellungen, die hier betrachtet werden soll, kann 
durch folgende Bedingungen exakt festgelegt werden: 

• Aus einer endlichen Grundgesamtheit vom Umfang N wird eine Stichpro- 
be vom Umfang n durch Ziehen ohne Zurücklegen gewonnen (n < N). 

• Das Ergebnis des z-ten Zuges (z = 1 , . . . , n) wird beschrieben durch die 
Zufallsvariable 

X _ f 1 z-ter gezogener Merkmalsträger hat Eigenschaft A 
1 [ 0 z-ter gezogener Merkmalsträger hat Eigenschaft Ä 

• Die Anzahl M der statistischen Einheiten in der Grundgesamtheit, die die 
Eigenschaft A aufweisen, ist bekannt und damit auch die Anzahl N — M 
der statistischen Einheiten in der Grundgesamtheit, die die Eigenschaft 
A nicht haben ( M < N). 

Entsprechend der in 2.5 betrachteten Fragestellung interessieren wir uns wie- 
der für die Wahrscheinlichkeit dafür, daß in der Stichprobe genau x statisti- 
sche Einheiten mit der Eigenschaft A auftreten: Gesucht ist die Wahrschein- 
lichkeitsverteilung der Zufallsvariablen 

x = ±x, 

i = 1 
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Kombinatorische Überlegungen führen uns zur Wahrscheinlichkeitsfunktion 

f„( x )-[ (™)( N n-¥)/(n) x = max{0,n-N+M},...,mm{n,M} 
;H{X) ~ \ 0 sonst 

für die Zufallsvariable X. Die durch diese Wahrscheinlichkeitsfunktion de- 
finierte Verteilung heißt Hypergeometrische Verteilung. Ihre Parameter sind 
offensichtlich der Stichprobenumfang n, die Größe der Grundgesamtheit N 
und die Anzahl M der statistischen Einheiten in der Grundgesamtheit mit 
der Eigenschaft A. Eine (diskrete) Zufallsvariable X mit dieser Wahrschein- 
lichkeitsfunktion heißt hypergeometrisch verteilt (mit den Parametern n, N 
und M), und wir schreiben dafür: 

X ~ HV(n,N,M). 



Die ersten beiden Momente, Erwartungswert und Varianz, einer hypergeo- 
metrisch verteilten Zufallsvariablen X ~ HV{n ) N ) M) sind: 



E(X) = 



M 

l N' 



V(X) = n 



M N-n 

W n - r 



Als Verteilungsfunktion erhält man schließlich 




E (M\ (N-M\ j (N\ 
x<xo V r / V n — x ) / Vn / 

0 



für xo > 0 
für xo < 0 



Zu summieren ist dabei über alle nicht-negativen Zahlen x, die nicht größer 
als xo sind und im Träger der Wahrscheinlichkeitsverteilung liegen. 

Setzt man n = M/N , dann erhält man als Erwartungswert bzw. 
als Varianz für eine hypergeometrisch verteilte Zufallsvariable die Formeln 
E{X) = 7i7r bzw. V(X) = t?7t(1 — 7 t)(N — n)/{N — 1). Ein Vergleich mit den 
entsprechenden Formeln für eine binomialverteilte Zufallsvariable ergibt: 

• Die Erwartungswerte stimmen überein. 

• Wegen lim#— oo (N — n)/(N — 1) = 1 (n endlich, fest) stimmen für un- 
endliche Grundgesamtheiten die Varianzen überein. 

Der Faktor ( N — n)/(N — 1) wird deshalb auch „Endlichkeitskorrektur“ ge- 
nannt. Es läßt sich sogar zeigen: Die Binomialverteilung BV{n, w) ist Grenz- 
verteilung der Hypergeometrischen Verteilung HV(n y N, M) (für N — ► oo, 
M — ► oo und M/N —+ w , n fest). Praktisch bedeutet dies, daß man bei 
großer Grundgesamtheit und kleinem Stichprobenumfang (man spricht von 
einem kleinen Auswahlsatz) zur Berechnung der entsprechenden Wahrschein- 
lichkeiten statt der „eigentlich zuständigen“ Hypergeometrischen Verteilung 
i/V(n, N f M) die Binomialverteilung BV(n , M/N ) benutzen kann. Dies gilt 
insbesondere dann, wenn eine endliche Stichprobe aus einer unendlichen 
Grundgesamtheit gezogen wird. Für endliche Grundgesamtheiten soll hier 
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und im folgenden zur Präzisierung des Begriffs „kleiner Auswahlsatz“ die 
Formel n/N < 0.05 verwendet werden (Faustregel für die Approximation der 
Hypergeometrischen Verteilung durch die Binomialverteilung). Die hier be- 
schriebene Approximation wollen wir symbolisch durch folgende Schreibweise 
darstellen: 

HV(n, N, M) BV(n, §) bei ft < 0.05. 

Aufgabe 2.7/1 Ein Los von 100 Stück soll laut Liefervertrag höchstens 5% 
Ausschuß enthalten. Zur Kontrolle werden beim Wareneingang jedem Los 
gleichzeitig 10 verschiedene Stücke entnommen. Das Los wird abgelehnt, 
wenn unter den entnommenen Stücken mindestens ein defektes Stück ist. 
Wie groß ist die Wahrscheinlichkeit für die Ablehnung eines Loses, das ge- 
rade noch den Vertragsbedingungen entspricht, und wie beurteilen Sie dieses 
Prüfverfahren? 



Aufgabe 2.7/2 

a) Eine Urne enthalte 5 Kugeln, davon seien 3 weiß und 2 schwarz. Man 
zieht eine Stichprobe vom Umfang 2 ohne Zurücklegen. Berechnen Sie die 
Wahrscheinlichkeiten dafür, jeweils keine, eine oder zwei weiße Kugeln zu 
erhalten. 

b) Berechnen Sie die entsprechenden Wahrscheinlichkeiten für eine durch 
Ziehen mit Zurücklegen gewonnene Stichprobe. Vergleichen Sie diese Er- 
gebnisse mit denen von a). 

c) Zeigen Sie für die in a) bzw. in b) angeführten Beispiele die Richtigkeit 
der jeweiligen Formeln für Erwartungswert und Varianz. 



Aufgabe 2.7/3 Von den 10449 Ende März 1990 registrierten Teilzeit- 
beschäftigten im Hochstift Paderborn waren 9759 Frauen (Westfalische Volks- 
zeitung 21./22. 11. 1990). Wie groß ist die Wahrscheinlichkeit, daß in einer 
durch 

• Ziehen ohne Zurücklegen 

• Ziehen mit Zurücklegen 

gewonnenen Stichprobe vom Umfang 10 aus dieser Grundgesamtheit nur 
Frauen sind? 

Ergänzungen und Bemerkungen 

• Eine ausführliche Darstellung der Zusammenhänge zwischen verschiede- 
nen Definitionen für Zufallsstichproben und Hypergeometrischer Vertei- 
lung sowie Binomialverteilung gibt Basler (1991). 
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• Zum Beweis des Satzes, daß die Binomialverteilung unter bestimmten 
Bedingungen Grenz Verteilung der Hypergeometrischen Verteilung ist, ver- 
gleiche man Fisz (1976), Abschnitt 5.4 zur Polya- Verteilung. 

• Die Festlegung n/N < 0.05 für einen kleinen Auswahlsatz stellt natürlich 
nur eine — wenn auch in Lehrbüchern weit verbreitete — Konvention dar. 
Das gleiche gilt auch für weitere in diesem Buch angeführte „Faustregeln“. 



2.8 Poisson-Verteilungen 

Die Poisson-Verteilung wurde von dem französischen Naturwissenschaftler 
Simeon-Denis Poisson (1781 - 1840) in einer 1837 erschienenen Schrift als 
Grenz Verteilung der Binomialverteilung eingeführt: 

Sind die Zufallsvariablen X n binomialverteilt mit den Parametern n und 
7r n für n — 1 , 2 , ... so, daß n7r n für n — ► oo gegen eine Zahl A > 0 konvergiert, 
dann konvergieren die X n für n — ► oo gegen eine Zufallsvariable X mit der 
Wahrscheinlichkeitsfunktion 




für x = 0, 1, 2, . . . 
sonst. 



Die dadurch definierte Verteilung heißt Poisson-Verteilung mit dem Para- 
meter A. Eine Zufallsvariable X mit dieser Wahrscheinlichkeitsfunktion heißt 
Poisson-verteilt mit dem Parameter A, und wir schreiben dafür: 



V - PV( A). 



Es gilt E(X ) = A = V(X), und als Verteilungsfunktion dieser diskreten 
Zufallsvariablen (mit abzahlbar unendlichem Wertebereich) erhält man 




~xT e 

0 



für xo > 0 
für xq < 0. 



Dabei wird über alle nicht-negativen ganzen Zahlen, die kleiner oder gleich 
xo sind, summiert. (Vgl. Tabelle 1 im Anhang.) 

Bei der praktischen Anwendung der Poisson-Verteilung beachte man, 
daß aufgrund der Bedingung mr n — ► A bei dem oben beschriebenen Grenzpro- 
zeß n — ► oo auch gleichzeitig 7r n — ► 0 gelten muß. Hieraus läßt sich ableiten, 
daß die Poisson-Verteilung PV( A) für A = nir bei großem Stichprobenum- 
fang n und gleichzeitig kleiner Wahrscheinlichkeit i r eine hinreichend gute 
Approximation der Binomialverteilung BV(n,7r) darstellt. Als Faustregel 
für „großes n und keines i r“ wollen wir n > 50 und 7r < 0.1 verwenden. 
Diese Approximation bezeichnen wir symbolisch durch 



BV(n, 7r) PV(mr) für n > 50, 7r < 0.1 . 
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Tendenziell ist ein umso größeres n erforderlich, je kleiner 7r ist (häufig hat 
man als Faustregel auch m r > 5). Entsprechend eignet sich die Poisson- 
Verteilung als Modell für empirische Verteilungen, wenn eine Bernoullische 
Versuchsanordnung mit sehr vielen Einzelversuchen (n groß) und einem beim 
Einzelversuch sehr unwahrscheinlichen Ereignis A (7r klein; seltenes Ereignis 
Ä) vorliegt. Beispiele hierfür sind: 

• die pro Zeiteinheit von einer Unfallversicherung abzuwickelnden Scha- 
densfälle mit einer Schadenssumme über 1 Million DM 

• die pro Minute am Ausleihschalter einer Bibliothek abzufertigenden Per- 
sonen 

• die Anzahl der Druckfehler pro Buchseite bei einem sehr sorgfältig arbei- 
tenden Autor. 

Ist hierbei A = mr = E(X), also die durchschnittliche Merkmalsausprägung 
von X, bekannt, so kann man statt der eigentlich zuständigen Binomialver- 
teilung BV{n,n) die Poisson-Verteilung PV( A) als theoretische Verteilung 
verwenden. 

Aufgabe 2.8/1 

a) Beschreiben Sie für ein genanntes Beispiel die unterstellte Bernoullische 
Versuchsanordnung. Welche Voraussetzung wird dabei getroffen? Muß 7T 
bekannt sein? 

b) Kann man die Poisson-Verteilung auch als Grenzverteilung der Hypergeo- 
metrischen Verteilung auffassen? 



Aufgabe 2.8/2 Der Anteil von Negativreaktionen auf eine Malariaschutz- 
impfung betrage 0.2%. Wenn 1000 Menschen geimpft werden, wie groß sind 
die Wahrscheinlichkeiten dafür, daß bei 

• null 

• höchstens drei 

• mindestens fünf 

Personen Nebenwirkungen auftreten? 



Aufgabe 2.8/3 „In fertigen und getesteten Programmen, schätzen Infor- 
matiker, liegt pro 5000 Zeilen Code noch mindestens ein Fehler verborgen“ 
(Der Spiegel Nr. 42 (1990), S.93). 

a) Bestimmen Sie jeweils unter der günstigsten Annahme der Experten die 
Verteilung der Zufallsvariablen 
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al) X=„Anzahl der Fehler pro 5000 Zeilen Code“, 
a2) y=„ Anzahl der Fehler pro 10000 Zeilen Code“. 

b) Wie groß ist dann jeweils die Wahrscheinlichkeit dafür, daß ein Programm 
mit 5000 Zeilen 

bl) genau 2 Fehler enthält 
b2) höchstens 2 Fehler enthält 
b3) mehr als 2 Fehler enthält? 



Aufgabe 2.8/4 Ein Unternehmen liefert isolierten Draht in Rollen zu je 
100m Länge. Es wird garantiert, daß die Wahrscheinlichkeit für mehr als 
drei fehlerhafte Stellen in der Isolierschicht einer Rolle nur 0.143 beträgt. 
Wie viele fehlerhafte Stellen sind auf einer Rolle zu erwarten? 



Aufgabe 2.8/5 Montags zwischen 7.30 und 8.00 Uhr sind an einer Tank- 
stelle durchschnittlich 2 Kunden zu bedienen. Wie groß ist die Wahrschein- 
lichkeit, daß während dieser Zeit 3 Kunden zu bedienen sind? 



Ergänzungen und Bemerkungen 

• Auch für Poisson-verteilte Zufallsvariable sind die Werte von fp(x) ta- 
bellarisch zusammengefaßt; eine kleinere Tabelle finden Sie im Anhang; 
ausführliche z.B. in Owen (1962). 



2.9 Multinomialverteilungen 

Wie im Falle der Binomialverteilung interessieren wir uns wieder für ein Zu- 
fallsexperiment, das sich unter gleichen Bedingungen n-mal wiederholen läßt. 
Auch setzen wir wieder voraus, daß die einzelnen Durchführungen des Zufalls- 
experiments (Versuche) sich nicht gegenseitig beeinflussen. Bei jedem einzel- 
nen Versuch soll jetzt jedoch interessieren, ob eines der Ereignisse A \ , . . . , Ak 
eintrat, wobei gelten soll: die Ereignisse Aj (j = 1, . . . , k) sind disjunkt und 
schöpfen den Ergebnisraum fi des Zufallsexperiments vollständig aus (d.h. 
{Aj}j - 1 . bildet eine Zerlegung von Q). Beispiele hierfür sind: 

• Ein Würfel wird 20-mal geworfen, und unser Interesse gilt bei jedem Wurf 
den Ereignissen Ai, . . . , Ae mit A,=„die Augenzahl i fällt“, 

• Aus einer Urne mit 10 roten, 5 grünen und 5 gelben Kugeln wird 10-mal 
eine Kugel entnommen und festgestellt, welche Farbe diese hat. Nach 
jedem Zug wird die entnommene Kugel in die Urne zurückgelegt. Wir 
interessieren uns für die Zahl der roten, gelben und grünen Kugeln in der 
Stichprobe. 
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Zufallsexperimente dieser Art lassen sich wie folgt exakt erfassen: 

• Ein Zufallsexperiment, dem der Ergebnisraum fi zugrundeliegt, wird n- 
mal wiederholt (n ist eine natürliche Zahl, also insbesondere endlich). 

• Sei Ai , . . . , Ak eine Zerlegung von Q, d.h. 

k 

Aj = fi und A r fl A s = 0 für r ^ s. 
j = i 

Bei jedem Einzelversuch i ( i = 1, . . .', n) interessiert, welches der Ereig- 
nisse Aj (j = 1,...,ä?) eingetroffen ist. Das Ergebnis eines Versuches i 
läßt sich also durch einen Vektor x^) = (x^, . . . , xjj.^) € {0, 1}* beschrei- 
ben. Ist dabei A r eingetroffen, so hat dieser Vektor folgendes Aussehen: 
x^ = 1 und alle x*^ = 0 für s ^ r. xO) läßt sich also als Realisation ei- 
ner fc-dimensionalen Zufallsvariablen X^) auffassen, die aus k dichotomen 
Zufallsvariablen xj 1 ^ (j = 1, . . . , k) besteht: 

• Die Zufallsvariablen X^ sind unabhängig. 

• W{Aj) = W(X^ = 1) = Wj sei bekannt und konstant für alle Versuche 
i = 1, . . . , n. Es gilt natürlich 



k 

= L 
i = i 

Ist man nun an der Wahrscheinlichkeit interessiert, daß bei n Versuchen das 
Ereignis A\ genau xi-mal, das Ereignis A 2 genau X 2 -mal, . . . , das Ereignis Ak 
genau x*-mal eintritt (wobei x j = n )> dann läßt sich diese Fragestellung 
wie folgt präzisieren: 

Gesucht ist die Wahrscheinlichkeitsverteilung der ^-dimensionalen Zu- 
fallsvariablen 



X = (X u ...,X k ) = ^2 X& mit Xj = Xf\ j = 1, . . . , 



1 = 1 



Kombinatorische Überlegungen ergeben 
•••.,**) = | Xk,lri 



i-1 



k k x i =0, Ylj=\ x i = n 



sonst 
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als Wahrscheinlichkeitsfunktion der fc-dimensionalen Zufallsvariablen X . Die 
durch diese Wahrscheinlichkeitsfunktion definierte Verteilung heißt Muttino - 
mialverteilung mit den Parametern n, ttj, . . . , tt*. Entsprechend heißt eine 
Zufallsvariable X mit dieser Wahrscheinlichkeitsfunktion multinomialverieitt: 



X ~ MV(n, Tri,... ,**). 

Die eindimensionalen Randverteilungen der Xj ( j = 1 , . . . , Ar) sind jeweils 
binomial: ~ BV(n y Trj). Also haben wir 

E(Xj) = TlTTj und V’(Xj) = 7l7Tj(l - 7Tj), j = 1, . . . , fc. 

Ferner sind die eindimensionalen Randverteilungen untereinander negativ 
korreliert: 

Cov(X r , X 8 ) = — n7r r 7r Ä , r, s = 1, . . ., fc, r ^ s. 

Wegen der Beziehung J2j=i n reicht zur Beschreibung von X natürlich 
die (fc-l)-dimensionale Zufallsvariable (X \, . . . , Xk-i) aus. Im Falle k = 2 
erhält man die (eindimensionale) Binomialverteilung. 



Aufgabe 2.9/1 Die erwerbstätige Bevölkerung einer Kleinstadt setzt sich 
wie folgt zusammen: 40% Arbeiter, 30% Angestellte, 20% Selbständige, 10% 
andere. Zum Jahreswechsel befragt die Lokalzeitung 10 zufällig ausgewählte 
Erwerbstätige nach ihren Zukunftserwartungen. Wie wahrscheinlich ist es, 
daß 2 Arbeiter , 3 Angestellte und 5 Selbständige befragt werden? 



Aufgabe 2.9/2 In einer Bevölkerung seien 50% katholisch und 40% evange- 
lisch. Wie groß ist die Wahrscheinlichkeit, daß unter 6 zufällig ausgewählten 
Personen genau 3 katholisch und 2 evangelisch (d.h. eine Person weder ka- 
tholisch noch evangelisch) sind? 



Ergänzungen und Bemerkungen 

• Die Reihe der von uns eingeführten diskreten Wahrscheinlichkeitsver- 
teilungen ist keineswegs vollständig; zu weiteren Konzepten bzw. Ver- 
allgemeinerungen vergleiche z.B. Feiler (1968), Fisz (1976) oder Pa- 
tel/Kapadia/Owen (1976). 



2.10 Normalverteilungen 

Die überragende Bedeutung der Normalverteilung für die Wahrscheinlich- 
keitstheorie und die Statistik wurde historisch bereits sehr früh deutlich: 
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• In einer 1733 erschienenen Schrift entwickelte Abraham de Moivre (1667 — 
1754) die Normalverteilung als Grenzverteilung der Binomialverteilung. 
Auch Pierre Simon Laplace (1749-1827) beschäftigte sich mit der Appro- 
ximation der Binomialverteilung durch die Normalverteilung. 

• Carl Friedrich Gauß (1777-1855) zeigte, daß Meßergebnisse, die durch 
sehr viele unabhängig voneinander wirkende Fehlerquellen (Meßgenau- 
igkeit der benutzten Meßgeräte, Ableseungenauigkeiten des Beobachters 
usw.) zufällig beeinflußt werden, approximativ normalverteilt sind, wenn 
nur vorausgesetzt wird, daß für alle Fehlerquellen die Fehlerauswirkungen 
auf die Meßergebnisse einer identischen Wahrscheinlichkeitsverteilung mit 
endlichem Mittelwert und endlicher Varianz folgen. 

Aus diesen beiden unterschiedlichen Herleitungen der Normalverteilung wird 
bereits die Wichtigkeit dieser Verteilung für die Statistik (sowohl für theore- 
tische Überlegungen als auch für praktische Anwendungen) klar: 

• Als Grenzverteilung der Binomialverteilung und — wie man heute weiß 
— vieler anderer (diskreter wie auch stetiger) Verteilungen dient sie der 
Approximation dieser Verteilungen bei sehr vielen Wiederholungen des 
entsprechenden Zufallsexperiments (n groß). 

• Einer Reihe empirisch beobachtbarer Größen, die bestimmten, jedoch sehr 
allgemeinen Bedingungen genügen, lassen sich stetige Zufallsvariablen zu- 
ordnen, die normalverteilt oder zumindest annähernd normalverteilt sind, 
d.h. die Normalverteilung ist eine wichtige theoretische Verteilung. 

• Ein spezielles, in der induktiven Statistik im Mittelpunkt stehendes Zu- 
fallsexperiment ist das Ziehen einer Stichprobe. Eine Reihe für die Schätz- 
und Testtheorie wichtige, dieses Zufallsexperiment charakterisierende Zu- 
fallsvariablen sind annähernd normalverteilt. 

Während wir auf diese Überlegungen im Abschnitt 2.14 noch näher eingehen, 
wollen wir uns jetzt der Definition einer normalverteilten Zufallsvariablen 
zuwenden. Die durch die Dichte 

/jv(x) = —e~ , X G R, 

( 7 

für (T,/i G R mit er > 0 definierte Wahrscheinlichkeitsverteilung heißt Nor- 
malverteilung oder Gauß-Verteilung. Die Normierungs- Konstante c/v = 
0.3989 ... ist definiert als c/v = 1/\/2tt (tt = 3.14 .. . ist hier die Kreiszahl), 
e* bezeichnet die Exponentialfunktion mit Basis e = 2.718 .. . . Eine stetige 
Zufallsvariable X mit dieser Dichte heißt normalv erteilt mit den Parametern 
// und er, und wir schreiben dafür: 
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Als Erwartungswert bzw. Varianz einer normalverteilten Zufallsvariablen 
X ~ NV(fi,<r) erhält man: 

E(X) = fi, V(X) = * 2 . 

Die Verteilungsfunktion ist definiert durch 

/ X 0 1 

dx, x 0 eR. 

-00 

Betrachten wir die Dichtefunktion einer normalverteilten Zufallsvariablen X 
mit E(X) = n und V(X) = <t 2 etwas genauer (man erhält hieraus erste 
Aufschlüsse darüber, welche empirischen Größen sich eventuell durch eine 
normalverteilte Zufallsvariable darstellen lassen): 




Abbildung 2.2: NV(0,a) mit a) er = 1, b) er = 2 



• Als graphische Darstellung der Dichtefunktion erhält man eine Glocken- 
kurve (siehe Abbildung 2.2). 

• Die Dichtefunktion ist achsensymmetrisch zur Geraden x = fi\ die Vertei- 
lungsfunktion ist punktsymmetrisch zu (/z,0.5). 

• Die Dichtefunktion hat genau ein Maximum, und zwar bei x = fi. 

• Sie hat zwei Wendepunkte bei x = 

• Ihre beiden Äste nähern sich asymptotisch der Abzisse. 

• Ersetzt man /i durch fi f = fi + a, so verschiebt sich die Glockenkurve im 
ganzen um a in Abszissenrichtung. 

• Ersetzt man er durch a' = 6<r, wobei 0 < b < 1 bzw. b > 1, so wird die 
Glockenkurve in Ordinatenrichtung um b gestaucht bzw. gestreckt und in 
Abszissenrichtung um 1/6 gestreckt bzw. gestaucht. 
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Eine Sonderstellung unter den normalverteilten Zufallsvariablen nimmt die 
Zufallsvariable ein, die normalverteilt ist mit dem Erwartungswert 0 und der 
Varianz 1. Wir wollen diese deshalb mit T bezeichnen: 

T~NV( 0,1). 

Ihre Dichtefunktion hat die Darstellung 

/t(0 — CNe~2 t , t £ R. 

Eine Zufallsvariable T mit dieser Dichtefunktion heißt standardnormalver- 
teilt', NV( 0, 1) nennt man die Standardnormalverteilung. Die Bedeutung der 
Standardnormal Verteilung liegt im folgenden: 

Jede normal verteilte Zufallsvariable X mit dem Erwartungswert /z und 
der Varianz er 2 , X ~ NV(fi,<r), läßt sich standardisieren, d.h. durch die 
lineare Transformation T = (X — \i)ja in die standardnormalverteilte Zu- 
fallsvariable T transformieren. Dies ist ein Spezialfall folgender Eigenschaft: 

X~NV(ii,cr) => bX + a~ NV(bfi + a,\b\a). 

Zur Berechnung bestimmter Wahrscheinlichkeiten kann man die Standardi- 
sierung wie folgt benutzen: 

F n (x 0 ) = W(X < * 0 ) = W < to = 

= W(T<t 0 ) = F T (t 0 ). 

Jede Frage nach der Wahrscheinlichkeit, mit der eine normal verteilte Zufalls- 
variable bestimmte Werte annimmt, läßt sich also — nach Standardisierung 
— mit Hilfe der Verteilungsfunktion der Standardnormalverteilung beant- 
worten. Aus diesem Grunde genügt es, die Werte der Verteilungsfunktion 
der Standardnormalverteilung tabelliert vorliegen zu haben. Da aufgrund 
der Symmetrie der Dichtefunktion 

Fn(-xo) = 1 — Fn(x o) 

gilt, kann man sich bei der Tabellierung der NV( 0, 1) auf Werte t > 0 be- 
schränken. Im Anhang dieses Buches finden Sie die Funktion 

$(*) = W(-t <T<t) 

für einige spezielle Werte t > 0 tabelliert (Tabelle 2, siehe auch Abbildung 
2.3). Sie gibt die Wahrscheinlichkeit an, daß die Realisation einer NV(n,<r)- 
verteilte Zufallsvariablen im zentralen Schwankungsintervall [fi — tcr, \i + tc r] 
liegt. Offensichtlich gilt 

*(*) = F T (t) - F T (-t) = 2F T (t) - 1, 



*o - jA 
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Abbildung 2.3: Standardnormalverteilung und $(t) 



so daß sich die Verteilungsfunktion aus dieser Tabelle ableiten läßt. Die 
Tabellierung der Werte von $(t) hat jedoch einige rechentechnische Vorteile 
für bestimmte Problemstellungen in der Schätz- und Testtheorie. 

Eine wichtige Eigenschaft, die sogenannte Reproduktionseigenschaft , nor- 
malverteilter Zufallsvariabler sei zum Schluß dieses Abschnitts genannt: 

Sind Xi ~ NV(m, er*) für i = 1, . . . , n unabhängig, dann ist 



n 

X = ao + ^ ^ a>iXi 

i= 1 



NV üq + ^ a* 



Pi 



i = 1 






E 

1 = 1 






für konstante reelle Zahlen a,* (i = 0, . . . , n) (X ist eine lineare Transformation 
der unabhängigen Zufallsvariablen X{). 

Gilt dabei insbesondere fi\ = . . . = fi n = (i, cr x = . . . = a n = <r, ao = 0 und 
öi = . . . = a n = 1, so erhält man 



n 

X = J2 X i ~ NV («/*,*>/»*) • 
1=1 



Aufgabe 2.10/1 Erläutern Sie die folgenden Aussagen: 

a) Die Normal Verteilung ist eine stetige Verteilung. 

b) Die Normalverteilung ist eine eindimensionale Verteilung. 

c) Die Normalverteilung ist die wichtigste Verteilung. 



Aufgabe 2.10/2 Betrachten Sie BV(n, sowie BV(n, 1) für n = 2,4, 12. 
Stellen Sie die jeweiligen Wahrscheinlichkeitsfunktionen graphisch dar und 
versuchen Sie, sich anhand der graphischen Darstellung der Wahrscheinlich- 
keitsfunktionen Bedingungen für die Approximation der Binomialverteilung 
durch die Normalverteilung klar zu machen. 
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Aufgabe 2.10/3 Die Stärke eines Geldscheins sei normalverteilt mit Mit- 
telwert 0.03 cm und Standardabweichung 0.004 cm. Bestimmen Sie die Ver- 
teilung der Höhe eines Geldscheinbündels, das aus 150 Geldscheinen besteht. 



Aufgabe 2.10/4 

a) Für eine normalverteilte Zufallsvariable X mit Erwartungswert -2 gilt 
W(X > 3) = 0.81594. Bestimmen Sie die Standardabweichung von X. 

b) Für eine normalverteilte Zufallsvariable X mit Erwartungswert 10 und 
Standardabweichung 2 bestimme man die Größe c so, daß W(X < c) = 
0.08 (gerundet) gilt. 



Aufgabe 2.10/5 Der Durchmesser der in einer Röhrenfabrik hergestellten 
Teilstücke einer Pipeline sei normal verteilt mit Mittelwert 1200 mm und 
Standardabweichung er — 50 mm. 

a) Berechnen Sie die Wahrscheinlichkeit dafür, daß eine zufällig ausgewählte 
Röhre einen Durchmesser von 

• weniger als 1150 mm, 

• zwischen 1150 mm und 1210 mm, 

• mindestens 1210 mm, 

• mehr als 1230 mm besitzt. 

b) Röhren, die um mehr als 5% vom Mittelwert abweichen, gelten als Aus- 
schuß. Wieviel Prozent Ausschuß sind zu erwarten? 

c) Welche Bedeutung hat die Standardisierung einer normalverteilten Zu- 
fallsvariablen? 



Ergänzungen und Bemerkungen 

• Es kann gezeigt werden: Sind X\ und X 2 unabhängig, dann ist die Zu- 
fallsvariable X = Ai -f X 2 genau dann normal verteilt, wenn X\ und X 2 
normal verteilt sind. 

• Zu den am Schluß erwähnten Eigenschaften der Normalverteilung (ge- 
nauer: von Funktionen normalverteilter Zufallsvariablen) vgl. Kalbfleisch 
(1979), Abschnitt 6.6 und Abschnitt 7.3. 
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2.11 Exponent ial-, Weibull- und Gammaver- 
teilungen 



Ein wichtiges Beispiel für eine Poisson-verteilte Zufallsvariable ist die Anzahl 
des Eintreffens eines seltenen Ereignisses innerhalb eines festen Zeitraumes T 
(vgl. Abschnitt 2.8). Hieraus läßt sich ableiten, daß die Zeit X , die zwischen 
dem Eintreten zweier Ereignisse verstreicht (die Anzahl des Eintretens sei 
Poisson-verteilt mit dem Parameter A > 0) eine Zufallsvariable mit folgender 
Dichtefunktion ist: 



Ie{x) 



Xe Xx x > 0 
0 x < 0. 



Die zugehörige Wahrscheinlichkeitsverteilung heißt Exponentialverteilung mit 
dem Parameter A (siehe Abbildung 2.4). Eine Zufallsvariable X mit der 




Abbildung 2.4: EV( A) mit A= a) 0.5 b) 1.0 c) 1.5 



beschriebenen Dichtefunktion heißt exp oneniialv erteilt mit dem Parameter 
A: 



X ~ EV( A). 



Für den Erwartungswert und die Varianz einer Zufallsvariablen X ~ EV( A) 
gilt: 

E(X) = 1/A, V{X) = 1/A 2 . 

Schließlich ergibt sich als Verteilungsfunktion durch Integration der Dichte- 
funktion: 

»TT / \ fl- e~ Xx ° x 0 > 0 

= { o ; o. 

Für Anwendungen in der Qualitätskontrolle und zur Modellierung von 
Lebensdauerverläufen technischer Aggregate eignet sich die Weibull- Vertei- 
lung. Die Zufalls variable X heißt W eibull-v erteilt mit den Parametern a und 

ß ( a,ß> 0), 



X ~ WV(a,ß), 
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falls die Dichtefunktion folgende Gestalt hat: 



fw( 



x) = | 



C \ßx ß 






für x > 0 



0 sonst 

Die ersten zwei Momente der Weibull- Verteilung sind: 

E(X) = a-Wr(i + i), V(X) = a-w [r(i + f ) - r(i + i) 2 



r(#c), die Gammafunktion, ist definiert durch 




dx. 



Für natürliche Zahlen k läßt sich die Gammafunktion jedoch einfacher dar- 
stellen: 



T(k) = (k - 1)! für k G N. 



In Abhängigkeit von den Parametern ergeben sich sehr unterschiedliche 
Verläufe für die Dichtefunktion (siehe Abbildung 2.5) Die Exponentialvertei- 




Abbildung 2.5: WV( l,ß) mit ß= a) 0.5 b) 1 c) 1.5 d) 3 



lungen sind spezielle Weibull- Verteilungen: die Weibull- Verteilung mit a=X 
und ß—\ ist gerade die Exponentialverteilung mit Parameter A. 

Betrachten wir noch einmal das in 2.11 eingangs erwähnte Beispiel und 
fragen diesmal aber nach der Zeitspanne bis zum «-maligen Eintreffen eines 
Ereignisses (« ist eine beliebige natürliche Zahl). Diese Zeitspanne X ist eine 
stetige Zufallsvariable mit folgender Dichtefunktion: 




A* „K-l \x 

ttxi x e 
0 



X > 0 
x < 0. 



Die Wahrscheinlichkeitsverteilung mit dieser Dichte heißt Gammaverteilung 
mit den Parametern « > 0 und A > 0. Sie ist auch für nicht-ganzzahliges « 
definiert (siehe Abbildung 2.6). Eine Zufallsvariable X mit der beschriebenen 
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Abbildung 2.6: rV(l,A) mit A= a) 0.5 b) 1 c) 1.5 d) 3 



Dichtefunktion heißt gammaverteilt: 



X ~ rv r (#c, A). 



Der Parameter A gibt die erwartete Häufigkeit des Eintreffens des betrach- 
teten Ereignisses innerhalb eines festen Zeitraumes wieder. Für den Er- 
wartungswert und die Varianz einer gammaverteilten Zufallsvariablen X ~ 
TV(k,\) gilt: 

E(X) = 9 c/A, V(X) = k/ A 2 . 

Als Verteilungsfunktion ergibt sich 




fo° M*) dx 

o 



x 0 > 0 

Xq < 0 . 



Aufgabe 2.11/1 

a) Zeigen Sie, daß fß(x) eine Dichtefunktion ist. 

b) Zeigen Sie: Die Exponentialverteilung ist ein Spezialfall der Gammaver- 
teilung. 



Aufgabe 2.11/2 Auf einem bestimmten Autobahnabschnitt ereignet sich 
im Durchschnitt jeden Tag ein Unfall. Berechnen Sie die Wahrscheinlich- 
keiten für folgende Ereignisse: 

a) An einem bestimmten Tag geschieht kein (ein) Unfall. 

b) An zwei aufeinanderfolgenden Tagen ereignet sich kein Unfall. 

c) Zwischen zwei Unfällen liegen a unfallfreie Tage (a = 1 und a = 3). 

d) Zwischen zwei Unfällen liegen höchstens 

• zwei unfallfreie Tage 
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• eine unfallfreie Woche. 



Ergänzungen und Bemerkungen 

• Von besonderer Bedeutung ist die Gammaverteilung im Rahmen der 
Bayesschen Schätztheorie (Diskussion „konjugierter Verteilungen“). 

• Für ganze Zahlen n gilt T(n) = (n — 1)!. Die Werte der Gammafunktion 
für halbzahlige Argumente erhält man mittels T(0.5) = yjü und r(x-f 1) = 
£r(:c), x > 0. 

• Die Weibull- Verteilung wurde von dem schwedischen Physiker W. Weibull 
1929 veröffentlicht. 



2.12 Chi- Quadrat-, Student- und F- Vertei- 
lungen 

Die folgenden Verteilungen dienen nicht zur Beschreibung von Stichproben- 
verfahren oder als Modelle für Zeit Verlaufsdaten, sondern werden für die In- 
ferenzmethoden benötigt. 

Sind Xi,...,Xi, standardnormalverteilte unabhängige Zufallsvariable, 
dann hat die Zufallsvariable \ 2 = Yli = l die folgende Dichtefunktion: 

f , x f [2- v l 2 /T(v/2)\x^- 2 )l 2 e- x l 2 für x > 0 
Jx2{X) ~ { 0 sonst 

Dabei ist T wieder die in Abschnitt 2.11 definierte Gammafunktion. Obige 
Dichtefunktion ist auch für nicht-ganzzahlige Werte von v definiert (siehe 
Abbildung 2.7). Eine Zufallsvariable x 2 mit dieser Dichtefunktion heißt x 2 - 




Abbildung 2.7: X 2 V(i/) mit v — a) 1 b) 2 c) 4 
verteilt mit v Freiheitsgraden oder kurz x 2 V(v)- verteilt: 

x 2 ~ X 2 ^). 
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Wie man unschwer erkennt, ist die X 2 V ( U )- Verteilung eine spezielle Gamma- 
verteilung, nämlich für A= 1/2 und k — v/2. Es gilt 

E(x 2 ) = v , V(x 2 ) = 2v. 

Für große v läßt sich die x 2 V{v )~ Verteilung durch die Normalverteilung mit 
dem Mittelwert und der Standardabweichung er = y/2 v approximieren. 

Ist X standardnormalverteilt und Y x 2 V{v)~ verteilt, und sind X,Y un- 
abhängig, so ist die Zufalls variable 



Student- oder t-verteilt mit v Freiheitsgraden, 

T~SV(v) 

d.h. die Dichtefunktion von T hat die Form 

r(iii) / t 2 \~ !L 2 1 

fs(t) = -p — 2 ( H — ) , -oo < t < oo 

v'WCf) V t'J 

Sie ähnelt der Standardnormalverteilung (siehe Abbildung 2.8). Es gilt 





Abbildung 2.8: SV (4) 

E(T ) = 0 für v > 1 und V(T) = für v > 2. Für v < 1 hat T kei- 
nen Erwartungswert, für i/ < 2 keine Varianz, d.h. die entsprechenden Inte- 
grale existieren nicht Für v—\ bezeichnet man die Student- Verteilung auch 
als Cauchy- Verteilung. Für große v läßt sich die SV (v)- Verteilung durch die 
Standardnormal Verteilung approximieren . 

Sind X\, X 2 unabhängig und x 2 -verteilt mit v\ bzw. i/ 2 Freiheitsgraden, 
so ist die Zufallsvariable 

Y - *iM 

F-verteilt mit V\ und i/ 2 Freiheitsgraden, 
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Abbildung 2.9: a) FV(6,4) b) FV(16,10)' 



d.h. die Dichtefunktion (siehe Abbildung 2.9 hat die Form 



My) = 



r((io+<' 2 )/2K l/2 <'^ / V l/2_1 

r(i/ 1 /2)r(v 3 /2)(v 3 +i/,y)C'i+>'j)/3 

0 



für y > 0 
sonst 



Es ist 

«>') = ^ für n > 2, 

nn = für ^ > 4. 

Für 1/2 <2 ist der Erwartungswert und für v-i < 4 die Varianz nicht definiert. 
Das Quadrat einer SV (v )- verteilten Zufallsvariable ist F- verteilt mit 1 und v 
Freiheitsgraden. Ferner ist der Kehrwert einer FV(y 1 , 1 / 2 )- verteilten Zufalls- 
variablen wieder F- verteilt und zwar mit v 2 und v\ Freiheitsgraden. 



Aufgabe 2.12/1 Welche Zufallsvariablen sind 

a) x^M-^rteilt? 

b) SV(i/)-ve rteilt? 

c) FV(v\, 1 / 2 )-' verteilt? 



Aufgabe 2.12/2 Bestimmen Sie anhand der Tabellen im Anhang des Bu- 
ches die Werte x, für die W(X < x) = 0.95 gilt, falls 



a) X~ X 2 K(5), 

b) X ~ SV(5), 

c) X ~ FV( 5,5) 
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Ergänzungen und Bemerkungen 

• Beweise der angeführten Sätze findet der mathematisch geschulte Leser 
in Krickeberg/Ziezold (1977). 

• Die Chi-Quadrat-Verteilung wurde im Zusammenhang mit der Entwick- 
lung des Chi-Quadrat-Testes durch Karl Pearson 1900 eingeführt. 1922 
erfuhr der Chi-Quadrat-Test durch R. A. Fisher eine Neufassung. 

• William Gosset (1876-1937) publizierte als Braumeister bei Guiness- 
Company in Dublin unter dem Pseudonym „Student“ seine insbesondere 
zur Behandlung kleiner Stichproben wichtigen statistischen Forschungs- 
arbeiten. Hierzu zählt auch die Herleitung der Student- Verteilung. 

• Die F-Verteilung wurde von R. A. Fisher (1890-1962) eingeführt (vgl. 
Barnard (1990)). 



2.13 Zweidimensionale Normalverteilungen 

Nachdem wir wichtige eindimensionale stetige Verteilungen kennengelernt ha- 
ben, soll zum Schluß noch eine mehrdimensionale stetige Verteilung vorge- 
stellt werden: die mehrdimensionale (multivariate) Normalverteilung. Aus 
Gründen der Übersichtlichkeit beschränken wir uns wieder auf die Darstel- 
lung der zweidimensionalen (bivariaten) Normalverteilung: Die durch die 
Dichtefunktion 

f 2 N (x,y) = — e -rr^ 

ncrxVYx/ 1 - e 2 



tx 



X -Hx 4 — y-HY 

o x ’ y oy 



für alle ( x,y ) £ R 2 definierte Wahrscheinlichkeitsverteilung heißt zweidimen- 
sionale oder bivariate Normalverteilung. Ein Zufallsvektor (X,Y) mit dieser 
Dichtefunktion heißt (zweidimensional) normalverteilt : 



(A, Y) ~ NV 2 (hx , Hy , <?x > <?y > &)■ 



Dabei sind hx = E(X), Hy = E(Y), <r 2 x = V(X), = V(Y) die Mo- 

mente der jeweiligen Rand Verteilungen, q ist der in Abschnitt 2.4 eingeführte 
Korrelationskoeffizient g(X y Y). 

Die besondere Bedeutung der zweidimensionalen Normalverteilung unter 
den stetigen zweidimensionalen Verteilungen beruht nicht zuletzt darauf, daß 
für eine zweidimensional normalverteilte Zufallsvariable (X,Y) gilt: 

X,Y sind unabhängig genau dann, wenn g(X, Y) = 0 ist, d.h. wenn X,Y 
unkorreliert sind. 
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Aufgabe 2.13/1 Definieren Sie die Dichtefunktion einer zweidimensionalen 
Zufallsvariablen (X, Y), für die gilt: 

R(X,Y) = 0, X - NV(0, 1), Y - NV( 0, 1). 



Aufgabe 2.13/2 

a) Erstellen Sie eine graphische Darstellung der Dichtefunktion der bivaria- 
ten Normalverteilung für g = 0, fix — f*Y — 0 und crx — <?Y — 1 - 

b) Welche geometrischen Figuren bilden die „Höhenlinien“ (Punkte gleicher 
Dichte) der Dichtefunktion der bivariaten Normalverteilung im allgemei- 
nen Fall? 



Ergänzungen und Bemerkungen 

• Für eine umfassende Übersicht über stetige Verteilungen verweisen wir 
auf Patel/Kapadia/Owen (1976). 

• Die mehrdimensionale Normalverteilung spielt eine zentrale Rolle bei der 
Konstruktion ökonometrischer Modelle (vgl. Bamberg/ Schittko (1979), 
Abschnitt 4.1) und für verschiedene multivariate Verfahren. 

2.14 Grenzwertsätze 

In diesem und im folgenden Abschnitt sollen nun die in Abschnitt 2.10 
genannten Gründe für die Bedeutung der Normalverteilung exakt gefaßt 
werden. Dies geschieht mit Hilfe von Grenzwertsätzen, die Aussagen über 
das Konvergenzverhalten einer Folge von Wahrscheinlichkeitsfunktionen bzw. 
Dichtefunktionen (lokale Grenzwertsätze) oder von Verteilungsfunktionen 
(globale Grenzwertsätze) erlauben. 

2.14.1 Gesetz der großen Zahlen 

Ausgangspunkt für die folgenden Betrachtungen ist der Begriff der stochasti- 
schen Konvergenz. 

Man sagt, eine Folge von Zufallsvariablen {A n } n= i 2 ,.. konvergiert sto- 
chastisch gegen Null , wenn für beliebige reelle Zahlen e > 0 gilt: 

lim W(\X n \ > e) = 0. 

n — *-oo 

Entsprechend versteht man unter der stochastischen Konvergenz einer Folge 
{A n } n= i 2 , ... gegen eine Zufallsvariable X, daß die Folge {X n — X} n= 1 , 2 ,... 
stochastisch gegen Null konvergiert, und unter der stochastischen Kon- 
vergenz einer Folge {Xn}n=i, 2 ,... gegen eine Konstante c, daß die Folge 
{X n — c} n= i 2 ,. . stochastisch gegen Null konvergiert. Unter dem (schwachen) 
Gesetz der großen Zahlen versteht man dann folgende Aussage: 
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Seien unabhängige Zufallsvariablen mit identischen Vertei- 

lungen (also insbesondere E(X{) = // und V(X{) = er 2 für alle i = 
1,2,...). Sei X n = das arithmetische Mittel der Zufallsva- 

riablen X \ , . . . , X n . Dann konvergiert {X n }n=i,2 ... stochastisch gegen //, 
d.h. 



lim W(\X n - fi\ > e) = 0 für alle £ > 0. 



Für den Spezialfall einer Bernoullischen Versuchsanordnung folgt daraus das 
sogenannte Bernoullische Gesetz der großen Zahlen: 

Seien Xi die in Abschnitt 2.5 beschriebenen Indikatorvariablen mit den 
Werten 1 für Eintreten des Ereignisses A im i-ten Versuch und 0 für 
Nicht-Eintreten. Dann gilt für die relative Häufigkeit des Eintretens des 
Ereignisses A, P n = ^ X — £ die absolute Häufigkeit): 



lim W(\P n — 7r| > e) = 0 für alle e > 0. 



Das Gesetz der großen Zahlen verdeutlicht den Zusammenhang zwischen 
dem Häufigkeitsbegriff und dem Wahrscheinlichkeitsbegriff und kann als 
Begründung für den frequentistischen Wahrscheinlichkeitsbegriff (in Situa- 
tionen, die beliebig oft unter gleichen Bedingungen wiederholbar sind) her- 
angezogen werden. 

2.14.2 Zentraler Grenzwertsatz 

Eine Folge von Verteilungsfunktionen {f r 'n}n=i,2,... einer Folge von Zufalls- 
variablen {X n }n=i, 2 ,.. heißt konvergent , wenn eine Verteilungsfunktion F 
existiert, so daß gilt: 

lim F n (x) = F(x) für alle x , in denen F stetig ist. 

n— *oo 

Die durch F definierte Verteilung heißt Grenzverteilung der Folge der Ver- 
teilungsfunktionen. Als Satz von Lindeberg-Levy bezeichnet man dann die 
folgende Aussage: 

Seien {A,} t= i 2 ,... unabhängige Zufallsvariablen mit identischer Verteilung 
(also insbesondere E(Xi) = fj, und V(X{) = er 2 für alle i ) und seien /i und 
er endlich. Ist F n die zur Zufallsvariablen 

n 

Y n = £(*< ~ nii)/(ay/K), 

* = 1 

der standardisierten Summe der ersten n A a , gehörende Verteilungsfunk- 
tion, dann gilt 

lim F n (x) = Ft(x) für alle x. 
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Die Grenzverteilung der Folge der Verteilungsfunktionen der Y n ist also die 
Verteilungsfunktion der Standardnormalverteilung. Daraus folgt, daß die 
Zufallsvariable Ya= \^ i unter den gegebenen Voraussetzungen asymptotisch 
normalverteilt ist mit dem Erwartungswert npt und der Standardabweichung 
( 7yjn . Dies drückt man so aus: 

Für 8^ unter den gemachten Voraussetzungen der zentrale 

Grenzwerts atz. 

Wir schreiben 

n 

Y^Xi*** NV(nti,oy/n). 

Dies ist die Begründung dafür, daß man viele Größen, die additiv aus vielen 
unabhängig voneinander wirkenden Zufallsgrößen entstehen (von denen keine 
einzelne einen zu großen Einfluß auf die Summe hat), durch asymptotisch 
normalverteilte Zufallsvariablen darstellen darf. 



2.14.3 Satz von de Moivre-Laplace 

Die „globale Version“ des Satzes von de Moivre-Laplace ergibt sich als Spezi- 
alfall des Satzes von Lindeberg-Levy. (Historisch ist der Satz von de Moivre- 
Laplace bereits vor dem Lindeberg-Levyschen Satz bewiesen worden.) 

Liegt eine Bernoullische Versuchsanordnung vor, so ist die „Anzahl“ X = 
binomialverteilt mit E(X) = mr und V(X) = mr(l — i r). Die Zu- 
fallsvariablen X{ sind unabhängig und identisch verteilt mit E(X{) = n < oo 
und V{Xi) = 7r(l — 7r) < oo. Nach dem Satz von Lindeberg-Levy gilt dann 
für die zu 



gehörende Verteilungsfunktion F n : 




lim F n (x) = Ft(x) für alle x. 

n— ►oo 



Also ist die Anzahl X asymptotisch normalverteilt mit Erwartungswert n7r 
und Standardabweichung y/n7r(l — w) ( Satz von de Moivre-Laplace). Wir 
schreiben 

X ~ BV(n , 7r) NV(n7r , \/nn(l — 7r)). 

Praktisch bedeutet dies: für hinreichend große n lassen sich die mit der Bi- 
nomialverteilung flF(n, 7r) zu berechne nden Wah rscheinlichkeiten mit Hilfe 
der Verteilungsfunktion der NV(mt , ^/n7r(l — 7r)) ermitteln. Dabei erhält 
man für n7r(l — n) > 9 bereits brauchbare Approximationen. Allerdings ist 
zu beachten, daß es sich bei der Binomialverteilung um eine diskrete, bei 
der Normalverteilung hingegen um eine stetige Verteilung handelt. Man ap- 
proximiert den Wert der Verteilungsfunktion der Binomialverteilung an der 
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Stelle x durch den Wert der Verteilungsfunktion der Normalverteilung am 
Zwischenwert x + Dies ist die sogenannte Stetigkeitskorrektur : 

Zur Berechnung von W(a < X < b) einer binomial verteilten Zufallsvariablen 
X mit Hilfe der entsprechenden Normalverteilung wählt man als Grenzen 
a — | bzw. b -f also: 



W(a < X < b) = F N (b + I) - F N (a - i), 

wenn X binomialverteilt ist und n7r(l — 7r) > 9 gilt. Diese Stetigkeitskor- 
rektur hat insbesondere den Effekt, daß die einzelnen Werte x = 0,...,n 
(mit positiven Wahrscheinlichkeiten) der diskreten Binomialverteilung durch 
die Intervalle (x — |, x + |] (mit positiven Wahrscheinlichkeiten) der stetigen 
Normalverteilung und nicht etwa durch Punkte (deren Wahrscheinlichkeiten 
0 sind) ersetzt werden. 

Schließlich sei noch die „lokale Version“ des Satzes von de Moivre- 
Laplace erwähnt: Für 0 < 7T < 1 gilt für die binomialverteilte Zufallsvariable 
X: 

lim (fB n {x)/fN n ( x )) = 1 - 

n— *-oo 

Dabei ist f^ n die zu NV(mr, ^/n7r(l — 7r)) gehörende Dichte und fß n die zu 
5F(n, 7r) gehörende Wahrscheinlichkeitsfunktion. 

Aufgabe 2.14/1 

a) Welches ist die grundlegende Voraussetzung bei allen in diesem Abschnitt 
betrachteten Grenzwertsätzen? 

b) Welche Bedeutung hat das Gesetz der großen Zahlen und wie läßt sich 
dieser Name deuten? 

c) Welche Konvergenzbegriffe liegen den hier betrachteten Grenzwertsätzen 
zugrunde? Spielt der Ihnen aus der Analysis her bekannte Konvergenz- 
begriff hier eine Rolle? 



Aufgabe 2.14/2 Der Frauenanteil an der Gesamtzahl der Beschäftigten 
liegt im Land NRW bei 41.4% (Ende März 1990). Wie groß ist die Wahr- 
scheinlichkeit, daß unter 100 zufällig ausgewählten Beschäftigten dieses Lan- 
des mehr als 30 Frauen sind (exakter Term zur Berechnung der Wahrschein- 
lichkeit und approximative Lösung mittels tabellierter Verteilung)? 



Aufgabe 2.14/3 Als Regel für eine brauchbare Approximation der Binomi- 
alverteilung durch die entsprechende Normalverteilung werden in der Litera- 
tur unter anderen genannt: 



- 7i7r(l — 7r) > 9 
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- n7r > 5 und n( 1 — ir) > 5 

- n7T > 5, falls 7 r > 0.5 

- min{n7r, n(l — 7r)} > 10. 

Welches Konstruktionsprinzip liegt allen diesen Regeln zugrunde? 



Aufgabe 2.14/4 Über Jahre hinweg hatte auf einem berüchtigten Auto- 
bahnabschnitt jeder 5. Unfall den Tod eines Beteiligten zur Folge. Nach 
langen Diskussionen wurde für dieses Teilstück eine Geschwindigkeitsbe- 
schränkung auf 100 km/h verfügt. Die verantwortlichen Politiker verkünden 
die Tatsache, daß von den seitdem dort vorgefallenen 120 Unfällen lediglich 20 
tödlich ausgingen, als Beweis für die Richtigkeit dieser Maßnahme. Können 
Sie dem zustimmen? 



Aufgabe 2.14/5 Eine Pharmagroßhandlung beliefert täglich 500 Apothe- 
ken. Die Wahrscheinlichkeit einer Reklamation beträgt bei allen Apotheken 
(unabhängig voneinander) 0.02. Die Wahrscheinlichkeit dafür, daß täglich 
zwischen 7 und 12 Apotheken reklamieren, soll bestimmt werden. 



Ergänzungen und Bemerkungen 

• Eine Verallgemeinerung des Satzes von Lindeberg-Levy stellt der Satz von 
Ljapunoff dar. Hier wird eine Aussage analog zum Lindeberg-Le vyschen 
Satz für beliebig (nicht mehr notwendigerweise identisch) verteilte un- 
abhängige Zufallsvariablen unter einer sehr allgemeinen (technischen) Zu- 
satzbedingung bewiesen: 
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(vgl. Fisz (1976), Abschnitt 6.9). 

• Die lokale Version des Satzes von de Moivre-Laplace ist ein Spezialfall 
des Satzes von Gnedenko, der einen lokalen Grenzwertsatz für diskrete 
Verteilungen liefert (vgl. Fisz (1976), Abschnitt 6.10). Ein Beweis des 
(lokalen und globalen) Satzes von de Moivre-Laplace findet sich auch in 
Kreyszig (1979), Anhang 1, 375-377). 

• Eine Darstellung weiterer Grenzwertsätze findet der Leser z.B. in Fisz 
(1976), Kapitel 6, oder in Büchern zur Wahrscheinlichkeitstheorie. 




Kapitel 3 

Statistische Inferenz: 
Einstichprobenfall und 
univariate Datensätze 



Bei den bisher betrachteten Problemstellungen lagen jeweils Kenntnisse über 
bestimmte Parameter der Verteilung, über den Typ der Verteilung oder 
die genaue Verteilung einer Zufallsvariablen selbst vor. Wahrscheinlichkeits- 
aussagen über bestimmte Ereignisse oder mögliche Stichprobenrealisationen 
(Stichprobengrößen) waren gesucht. Dieses Schließen von der Verteilung auf 
Realisationen der Zufallsvariablen nennt man direktes Schließen, Deduktion 
oder Inklusionsschluß. Wie man in den vorausgehenden Kapiteln sah, lie- 
fert die Wahrscheinlichkeitsrechnung adäquate Methoden für den Inklusions- 
schluß. Die für den Statistiker interessante und für die Praxis relevante Auf- 
gabe ist jedoch die umgekehrte Fragestellung: Wie lassen sich aufgrund von 
Zufallsvariablenrealisationen Aussagen über die Verteilung bzw. über deren 
Parameter treffen? Man spricht in diesem Zusammenhang vom indirekten 
Schließen oder statistischer Inferenz. Methoden des indirekten Schließens 
werden im Rahmen der induktiven Statistik entwickelt und sollen im folgen- 
den dargestellt und diskutiert werden. 

Klassischen statistischen Inferenzmethoden liegt folgende Ausgangssi- 
tuation zugrunde: Eine Gesamtheit aller relevanten statistischen Einheiten 
für eine bestimmte Fragestellung kann aus Kostengründen nicht erhoben wer- 
den. Deshalb wird mittels eines Zufallsauswahlverfahrens ein Teil der stati- 
stischen Einheiten ausgewählt (Teilerhebung, Stichprobe) und hinsichtlich 
eines oder mehrerer Merkmale untersucht, beobachtet oder befragt. Mittels 
der so gewonnenen Informationen und unter Berücksichtigung der Struktur 
des der Teilerhebung zugrundeliegenden Zufallsexperimentes werden Rück- 
schlüsse auf die interessierende Gesamtheit (Grundgesamtheit) gewonnen. 
Die so abgeleiteten Aussagen über die Grundgesamtheit können in der Regel 
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nur mit Unsicherheit behaftete Aussagen sein. Die gewählte Vorgehensweise 
über ein Zufallsexperiment erlaubt aber, diese Unsicherheit mit wahrschein- 
lichkeitstheoretischen Überlegungen zu quantifizieren und zu kontrollieren. 

Grundsätzlich lassen sich die Methoden der induktiven Statistik wie folgt 
einteilen: 

• Methoden, bei denen auf Grundlage einer Zufallsvariablenrealisation ein 
bestimmter Parameter der Verteilung oder diese selbst geschätzt werden 
soll: Schätzverfahren. 

• Methoden, bei denen eine Hypothese über die Verteilung oder ihre Para- 
meter aufgrund einer Realisation überprüft werden soll: Testverfahren. 

Bevor wir diese Verfahren exemplarisch im einzelnen vorstellen, soll aber die 
oben beschriebene Ausgangssituation noch einmal präzisiert werden. 



3.1 Grundlagen der Stichprobentheorie 

Soll aus den Informationen aus Teilerhebungen Aufschluß über die Merkmals- 
verteilung in der Grundgesamtheit gewonnen werden, so sind an die Auswahl- 
methode für die in der Teilerhebung zu erfassenden statistischen Einheiten 
der Grundgesamtheit bestimmte Anforderungen zu stellen. Diese Anforde- 
rungen sollen der Vermeidung von sogenannten systematischen Fehlem die- 
nen. Insbesondere muß gesichert sein, daß zwischen Auswahlkriterium und 
Untersuchungsziel kein Zusammenhang besteht. Im Rahmen der Stichproben- 
theorie sind hierzu eine Vielzahl entsprechender Auswahltechniken entwickelt 
worden. Wir wollen uns hier auf das Konzept der Zufallsauswahl aus einer 
gegebenen Grundgesamtheit mit festem Stichprobenumfang n beschränken: 
Von einer Zufallsauswahl spricht man dann, wenn der Vorgang der Stich- 
probenziehung und der Merkmalserhebung bei jeder gezogenen statistischen 
Einheit sich als Zufallsexperiment mit einer entsprechend definierten Zufalls- 
variablen beschreiben läßt. 

Für die Zufallsauswahl aus endlichen Grundgesamtheiten, bei denen 
Erhebungs- und Auswahleinheit identisch sind, (einstufige Stichproben) kann 
gefordert werden: 

• Jedes Element der Grundgesamtheit besitzt eine von Null verschiedene, 
vor der Ziehung feststehende und bekannte Wahrscheinlichkeit, in die 
Stichprobe aufgenommen zu werden. 

• Jedes Element der Grundgesamtheit besitzt die gleiche Wahrscheinlichkeit 
ausgewählt zu werden. 

• Die Elementarereignisse des Zufallsexperimentes „Ziehen einer Stichprobe 
vom Umfang n“ sind gleichwahrscheinlich (Laplace- Annahme), d.h. es gilt 
das Gleichmöglichkeitsmodell für die möglichen Stichprobenrealisationen. 
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Dabei ist jeweils die voranstehende Bedingung notwendig aber für n > 1 
nicht hinreichend für die folgende Bedingung. Erfüllt das Zufallsauswahlver- 
fahren die Laplace- Annahme, so sprechen wir von einer uneingeschränkten 
oder reinen Zufallsauswahl. Wird weiter gefordert, 

• die Ziehungen der n statistischen Einheiten erfolgen unabhängig vonein- 
ander, d.h. die Ergebnisse der einzelnen Ziehungen dürfen sich nicht ge- 
genseitig beeinflussen, 

so erhält man eine einfache Stichprobe vom Umfang n . Letztere Bedingung 
stellt man auch an Stichproben aus unendlichen Grundgesamtheiten. 

Ordnet man dem zu untersuchenden Merkmal die Zufallsvariable X zu, 
so mißt die Verteilungsfunktion F(x o) = W(X< xo) die Wahrscheinlichkeit, 
daß beim einmaligen Ziehen aus der Grundgesamtheit eine statistische Ein- 
heit ausgewählt wird mit der Ausprägung höchstens gleich zo- Man bezeich- 
net die Verteilung von X auch als die Grundgesamtheitsverteilung (bezüglich 
des Merkmals X) und ihre Parameter als Grundgesamtheitsparameter. 

Bezeichnet man mit Xi, der sogenannten Stichproben variablen, das 
Ergebnis der Feststellung der Merkmalsausprägung beim i- ten Zufallszug 
(i = 1, . . . , n), so läßt sich der Zieh Vorgang einer Stichprobe vom Umfang n 
durch (Ai, . . . , X n ) und dessen Verteilung beschreiben. Im Falle einer einfa- 
chen Stichprobe sind die Stichprobenvariablen offensichtlich alle unabhängig 
und identisch verteilt gemäß der Grundgesamtheitsverteilung, im Falle ei- 
ner uneingeschränkten aber nicht einfachen Stichprobe sind die Stichproben- 
variablen nicht unabhängig. Nur im ersten Falle läßt sich die gemeinsame 
Verteilungsfunktion als Produkt der Verteilungsfunktionen der Stichproben- 
variablen darstellen. 

Liegt eine endliche Grundgesamtheit vom Umfang N vor, deren Ele- 
mentekonkret existieren (endliche reale (konkrete) Grundgesamtheit ), so läßt 
sich eine Zufallsauswahl vom Umfang n z.B. wie folgt durchführen, bzw. 
durch das folgende Urnenmodell beschreiben: Man numeriert die Elemente 
der Grundgesamtheit von 1 bis N und gibt für jedes Element eine Kugel, 
beschriftet mit der entsprechenden Zahl, in eine Urne. Dann zieht man aus 
der verdeckten Urne nacheinander n Kugeln. Vor jedem Zug werden die in 
der Urne befindlichen Kugeln gut gemischt. Je nachdem, ob man die jeweils 
gezogene Kugel vor dem nächsten Zug wieder in die Urne zurücklegt oder 
nicht, unterscheidet man „ Ziehen mit Zurücklegen“ (Z.m.Z.) vom „ Ziehen 
ohne Zurücklegen“ (Z.o.Z.). 

• Z.m.Z. liefert eine einfache Stichprobe. Der Stichprobenumfang n könnte 
sogar größer als N gewählt werden. 

• Z.o.Z. ist ein Beispiel einer uneingeschränkten Zufallsauswahl, die keine 
einfache Stichprobe liefert. Hier ist immer n < N. 

Liegt ein kleiner Auswahlsatz vor, d.h. ist n/N klein, so ist die Unterscheidung 
zwischen Z.m.Z. und Z.o.Z. praktisch vernachlässigbar. Oft werden in der 
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Praxis deshalb Stichproben, die durch Z.o.Z. gewonnen wurden und für die 
n/N < 0.05 gilt, wie einfache Stichproben behandelt. Ist die Grundgesamt- 
heit unendlich und n endlich, so liegt auf jeden Fall ein kleiner Auswahlsatz 
vor. Im folgenden steht die Betrachtung einstufiger einfacher Stichproben 
aus endlichen Grundgesamtheiten im Vordergrund. 

Aufgabe 3.1/1 Diskutieren Sie folgende Auswahlverfahren und prüfen Sie 
jeweils, ob es sich um eine (einfache) Zufallsstichprobe handelt: 

a) Aus einer verdeckten Urne mit 10 Kugeln werden hintereinander 3 Kugeln 
gezogen. Jede gezogene Kugel wird vor dem nächsten Zug zurückgelegt. 

b) Aus einer verdeckten Urne werden 3 Kugeln auf einen Schlag gezogen und 
deren Farbe jeweils registriert. 

c) Aus der Kartei der Teilnehmer von Kursen einer Volkshochschule wird 
jede 10. Karteikarte gezogen und festgestellt, ob der entsprechende Kurs- 
teilnehmer weiblich oder männlich ist. 

d) Aus dem Telefonbuch einer Stadt wird jeder 100. Telefonbesitzer aus- 
gewählt, angerufen und — falls er sich meldet — in eine Befragung über die 
Einschätzung der Energiesituation der Bundesrepublik Deutschland ein- 
bezogen. 

e) Um Aufschluß über die für Wohnraum zu zahlenden Mieten in einer 
Stadt zu erhalten, werden die Mieter aller Wohnungen im Erdgeschoß 
der Hochhäuser dieser Stadt befragt. 

f) Zur Erforschung des betrieblichen Weiterbildungsangebots in einer Wirt- 
schaftsregion werden in 10 zufällig ausgewählten Wirtschaftsbranchen alle 
Unternehmungen mit mehr als 1000 Beschäftigten in eine Untersuchung 
einbezogen. 

g) Ziehung der Lottozahlen. 



Aufgabe 3.1/2 Zur Präsidentenwahl 1948 traten in den USA der seit 1945 
amtierende Präsident H. Sp. Truman von den Demokraten und der republi- 
kanische Herausforderer Th. E. Dewey an. Ein Meinungsforschungsinstitut 
sagte für den 1944 gegen Roosevelt unterlegenen Dewey dieses Mal einen kla- 
ren Sieg voraus. Die Prognose basierte auf einer Telefonumfrage. Die Wahl 
wurde jedoch von Truman gewonnen. Haben Sie eine Erklärung für diese 
Fehlprognose? Oder schließen Sie sich einfach der Meinung eines Bevölke- 
rungswissenschaftlers an, der am 30. 12. 1980 im SDR erklärte: „Es ist immer 
schwierig mit Prognosen, insbesondere wenn sie in die Zukunft gehen.“ 
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Ergänzungen und Bemerkungen 

• Zufallsaus wähl verfahren und Charakterisierungen derselben werden ein- 
gehend bei Basler (1991) oder Hartung (1982), Kapitel V, diskutiert. Zur 
konkreten Durchführung bedient man sich häufig sogenannter Zufallszah- 
len (vgl. Tabellen in Wetzel/Jöhnk/Naeve (1967) oder die Darstellung 
von stochastischen Simulations verfahren z.B. in Rinne/Ickler (1986)). 

• Weitere Stichprobenverfahren findet der interessierte Leser in Stenger 
(1983), Böltken (1976) und Henry (1990). 

• Das Problem verzerrter nicht repräsentativer Stichproben und falscher 
Schlüsse daraus wird in Krämer (1991), Kap. 8, anhand einiger Beispiele 
knapp und treffend dargestellt. 

• „Die zahlenmäßig größte und vielleicht auch bekannteste Stichprobe ist 
der Mikrozensus, die Repräsentativstatistik über die Bevölkerung und den 
Arbeitsmarkt. Die Befragung bezieht sich auf ein Prozent der Bevölke- 
rung, also auf rund 60000 Einwohner.“ (Holder (1985), S.34) 

• „Das in der amtlichen Statistik am häufigsten angewandte Auswahlver- 
fahren ist die geschichtete Zufallsauswahl. Die Grundgesamtheit wird in 
mehrere Gruppen, die sich gegenseitig ausschließen und zusammen die 
Grundgesamtheit voll ausschöpfen - in sogenannte Schichten — zerlegt. 
In jeder dieser Schichten erfolgt dann unabhängig von den anderen Schich- 
ten eine einfache Zufallsauswahl. Mit diesem Verfahren ist es möglich, das 
Ziehen von sehr ungünstigen Stichproben auszuschalten, ohne das Zufalls- 
prinzip aufzugeben. Beispielsweise kann durch eine Schichtung nach ei- 
nem quantitativen Merkmal verhindert werden, daß sich in der Stichprobe 
nur Einheiten mit großen Merkmalswerten befinden; bei einer Schichtung 
nach einer fachlichen Gliederung kann vermieden werden, daß sich die 
Stichprobeneinheiten zufällig auf eine Gliederungsposition konzentrieren. 
In der Regel ermöglicht die Schichtung einen erheblichen genauigkeits- 
steigernden Effekt gegenüber der einfachen Zufallsauswahl. Dieser Ge- 
nauigkeitsgewinn ist umso größer, je homogener die Auswahleinheiten in- 
nerhalb einer Schicht bezüglich des interessierenden Erhebungsmerkmals 
sind.“ (Statistisches Bundesamt (1990), S. 1) 



3.2 Bedeutung der Grenzwertsätze für die 
Infer e nzs t at is t ik 

Wir wollen jetzt für das Zufallsexperiment „Ziehen einer Stichprobe“ aus 
den Grenzwertsätzen aus Abschnitt 2.14 spezielle Aussagen ableiten. Eine 
genaue Betrachtung der in 2.14 vorgestellten Grenzwertsätze zeigt, daß wir 
uns in diesem Abschnitt auf einfache Stichproben beschränken müssen: In 
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diesem Fall sind die Stichprobenvariablen A* , die das i-te Ziehen eines Ele- 
ments aus der Grundgesamtheit (i = 1, . . . , n bei einer Stichprobe vom Um- 
fang n) repräsentieren, unabhängig, und damit ist eine wesentliche Voraus- 
setzung für die Anwendung der Grenzwertsätze erfüllt. Das Zufallsexperi- 
ment „Ziehen einer einfachen Stichprobe vom Umfang n“ (z.B. durch Ziehen 
mit Zurücklegen) wird repräsentiert durch die n-dimensionale Zufallsvariable 
(Ai, . . . , X n ). Eine Funktion g(X i, . . . , A n ) der Stichprobenvariablen heißt 
Stichprobenfunktion (oder Statistik). Stichprobenfunktionen sollen die In- 
formationen einer Stichprobe (in möglichst eindimensionale Größen) zusam- 
menfassen. Sie sind vor der Durchführung des Experiments „Ziehen einer 
Stichprobe“ als Zufallsvariablen anzusehen: ihre Realisationen hängen von 
den zufällig in die Stichprobe gelangten statistischen Einheiten ab. 

Betrachten wir zunächst das Gesetz der großen Zahlen. Liegt eine einfa- 
che Stichprobe vor, dann sind die Xi(i = 1, . . . , n) unabhängig und identisch 
verteilt. Sei E(Xi) = p und V(Xi) = er 2 für alle i = 1, . . . , n. Dann ist der 
Stichprobenmittelwert 

X = Xn = -T X i 

eine Stichprobenfunktion, für die gilt: 

lim W(\X n -n\ > e) = 0. 

n—+oo 

Man kann das so interpretieren: Ist der Grundgesamtheitsparameter p un- 
bekannt, so ist die Stichprobenfunktion X n für große Stichprobenumfänge 
n eine gute Schätzfunktion für p, d.h. die Realisation x = x n dieser Stich- 
probenfunktion für eine vorliegende große Stichprobe ist eine relativ gute 
Schätzung für p. Die Wahrscheinlichkeit, daß X n sehr stark vom wahren, 
aber unbekannten Wert p ab weicht, ist aufgrund des Gesetzes der großen 
Zahlen nicht sehr hoch. Im Rahmen der Schätz theorie werden wir diese 
Gedanken weiterverfolgen und präzisieren. Halten wir hier nur noch fest, 
daß aus dem sogenannten Bernoullischen Gesetz der großen Zahlen eine ent- 
sprechende Aussage (wie für x n ) für den Stichprobenanteilswert, den wir p n 
nennen wollen ( p n ist die Realisation von P n ), folgt. 

Liegt eine normalverteilte Grundgesamtheit vor und betrachtet man eine 
einfache Stichprobe daraus als Zufallsvariable X = (Ai, . . . , A n ), so gilt nach 
2.10 (Reproduktionseigenschaft und lineare Transformation) für alle n : 

n 

~ NV(nfi, (Tyjn) 

1=1 



Xn = -Y,Xi~NV(jt,<r/y/n). 
Für V(X ) werden wir auch schreiben. 
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Die Stichprobenfunktion X n ist also normalverteilt für alle Stichproben- 
umfänge n. Ist die Verteilung der Grundgesamtheit unbekannt, so gilt jeden- 
falls für eine einfache Stichprobe X = (X \ , . . . , X n )\ X{ (i = 1, . . . , n) sind 
unabhängig und identisch verteilt. Es gilt wieder E(Xi ) = /i und V(X{) — a 2 
für i = 1, . . . , n, d.h. die Voraussetzungen des Zentralen Grenzwertsatzes sind 
erfüllt. Man erhält also für die zur Zufallsvariablen 

v _ ELi Xi-ng 



gehörenden Verteilungsfunktionen F n : 



lim F n (x) = Ft(x) für alle x. 



Praktisch bedeutet dies, daß die Stichprobenfunktion X n approximativ nor- 
malverteilt mit Mittelwert /i und Standardabweichung cr/y/n ist: 

1 n 

X n — - Xi ^ <r/y/n) für große n. 

i=i 

Als brauchbare Regel für die Verwendung der Normalverteilung für die Ver- 
teilung der Stichprobenfunktion X n im Falle einer unbekannten Grundge- 
samtheitsverteilung hat sich n > 30 erwiesen. 

In diesem Kapitel werden nur Stichproben zum festen Stichprobenum- 
fang n betrachtet. Aus diesem Grunde entsteht dort kein Informationsverlust 
(aber ein Zuwachs an Übersichtlichkeit), wenn wir statt X n lediglich X und, 
im Falle einer dichotoinen Grundgesamtheit, für den Stichprobeanteilswert P 
und die entsprechende absolute Anzahl X schreiben. Entsprechend verfahren 
wir im folgenden für die Realisationen dieser Stichprobenvariablen. 

Liegt eine dichotome Grundgesamtheit vor, so ist die Stichprobenfunk- 
tion X = Y^=iXi fü r e i ne einfache Stichprobe binomialverteilt mit dem 
Erwartungswert E(X) = nw und der Varianz V(X) = n7r(l — 7r). Aus dem 
Satz von de Moivre-Laplace folgt dann: Für große Stichprobenumfänge n 
(Faustregel: n7r(l — tt) > 9) gilt approximativ: 




Die Realisation x der Stichprobenvariablen X gibt dabei an, wie häufig das 
Merkmal A bei den in die Stichprobe (vom Umfang n ) gelangten statistischen 
Einheiten beobachtet wurde (Anzahl; absolute Häufigkeit). Aus dem Satz 
von de Moivre-Laplace folgt sofort für die Stichprobenfunktion P = X/n : 
Für große Stichprobenumfänge n (also mr(l — n) > 9) gilt approximativ 
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Die Realisation p der Stichprobenvariablen P gibt dabei die relative Häufig- 
keit an, mit der das Merkmal A in der Stichprobe vom Umfang n beobachtet 
wurde (Anteil). Beachten Sie, daß P ursprünglich eine diskrete Verteilung 
war (Stetigkeitskorrektur ±1/(2 n)). 

Wie man in diesem Kapitel sehen wird, bilden die hier abgeleiteten Ver- 
teilungen für den Mittelwert X (für beliebige Grundgesamtheitsverteilun- 
gen) und den Anteilswert P (im Falle dichotomer Grundgesamtheiten) die 
Grundlage für Inferenzmethoden bei großen Stichproben, die mathematische 
Fundierung einer statistischen Theorie des Schützens und Testens. 

Aufgabe 3.2/1 Der Anteil der Knaben an allen Neugeborenen betrage 0.5. 

a) Berechnen Sie auf zwei verschiedene Arten die Wahrscheinlichkeit dafür, 
daß der Anteil von Knaben in einer Stichprobe von 100 Neugeborenen 
größer ist als 0.6. 

b) Diskutieren Sie das Konzept einer Stetigkeitskorrektur im Zusammenhang 
mit dem Begriffspaar Anteil- Anzahl. 



Aufgabe 3.2/2 Wie groß ist die Wahrscheinlichkeit, daß der Mittelwert ei- 
ner Stichprobe vom Umfang 90 um mehr als eine Maßeinheit vom Grundge- 
samtheitsmittelwert ab weicht, wenn die Grundgesamtheitsvarianz 40 beträgt? 



Aufgabe 3.2/3 Die Zufallsvariable X habe die Grundgesamtheitsverteilung 
NV(—l, 3). Welche Verteilung hat: 

a) Y = iX + 7 

b) der Mittelwert einer einfachen Stichprobe vom Umfang 9 aus dieser 
Grundgesamtheit? 



Aufgabe 3.2/4 Die mittlere Betriebszugehörigkeitsdauer der Beschäftigten 
eines Unternehmens betrage 11.1 Jahre bei einer Standardabweichung von 
3 Jahren. Wie groß ist die Wahrscheinlichkeit, daß die mittlere Betriebszu- 
gehörigkeit von 100 zufällig Ausgewählten größer als 12 Jahre ist? 



Aufgabe 3.2/5 Es sei (aus Erfahrung) bekannt, daß beim Herstellen von 
Schrauben der Ausschußanteil 5% beträgt. Um die verschiedenen Fehler- 
arten und ihre relative Häufigkeit genauer untersuchen zu können, ist der 
Hersteller an einer repräsentativen Stichprobe interessiert. Wie groß muß 
diese sein, wenn mit einer Wahrscheinlichkeit von 95% unter den zufällig 
ausgewählten Schrauben zwischen 4% und 6% Ausschuß sein soll? (Die ex- 
akte Zahl hergestellter Schrauben könne aus verschiedenen Gründen nicht 
bestimmt werden.) 
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Ergänzungen und Bemerkungen 

• Wird eine Stichprobe vom Umfang n durch Ziehen ohne Zurücklegen ge- 
wonnen, sind die Stichprobenvariablen zwar noch identisch verteilt, aber 
nicht mehr unabhängig. Liegt eine normalverteilte Grundgesamtheit vor, 

so gilt X ~ NV(fi, <* I für alle n. Ist über die Verteilung der 
Grundgesamtheit nichts bekannt, kann der Zentrale Grenzwertsatz nicht 
direkt angewandt werden (fehlende Unabhängigkeit der Stichprobenva- 
riablen). Jedoch kann im Falle einer sehr großen Grundgesamtheit im 
Vergleich zum Stichprobenumfang (der allerdings auch groß sein muß) 
von einer approximativen Normalverteilung ausgegangen werden: 

X~NV t»w. P~NV 

(Vergleichen Sie die Ausführungen zur Approximation der Hypergeome- 
trischen Verteilung durch die Binomialverteilung in Abschnitt 2.7). Hin- 
zuweisen ist an die ser Stelle noch darauf, daß die sogenannte Endlichkeits- 
korrektur yj für N — ► oo gegen 1 konvergiert. Praktisch bedeutet 

dies, daß für einen kleinen Auswahlsatz (n/N < 0.05) die für „Ziehen mit 
Zurücklegen“ entwickelten Formeln approximativ auch für durch „Ziehen 
ohne Zurücklegen“ gewonnene Stichproben gültig sind (vgl. auch Hajek 
(I960)). 

• Die Verteilung einer Stichprobenfunktion bezeichnet man (etwas irrefüh- 
rend) als Stichprobenverteilung . 

• Die Varianz = V(X) heißt (durchschnittlicher) Stichprobenfehler, 

ist unabhängig von N (bei einfachen Stichproben) und umgekehrt pro- 
portional zu y/n. (In der betrieblichen Realität stellt die Tatsache, daß 
ein Halbieren des Stichprobenfehlers ein Vervierfachen des Stichproben- 
umfangs erfordert, einen erheblichen Kostenaspekt dar.) 

3.3 Punktschätzverfahren: Begriff und 
Methoden 

In diesem Abschnitt sollen Fragestellungen folgender Art betrachten werden: 

• „Studentenbefragung“ 

Eine Befragung von 101 Studenten einer Hochschule ergibt ein mittle- 
res verfügbares Einkommen von 890 DM/Monat bei einer Standardab- 
weichung von s n _ i = 30 DM/Monat. Läßt sich aus diesen Angaben 
eine Schätzung in Form einer genauen Zahlenangabe für das mittlere 
verfügbare Einkommen aller Studenten dieser Hochschule ableiten? 
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• „IHK-Bezirk“ 

Eine Untersuchung bei 100 Unternehmungen eines Industrie- und Han- 
delskammerbezirks ergibt, daß 50% der befragten Geschäftsführer die 
Konjunkturaussichten für das kommende Jahr positiv beurteilen. Wel- 
che Aussage läßt sich über den numerischen Wert des entsprechenden 
Anteils aller Unternehmungen im Bezirk treffen? 

Ausgangspunkt der Überlegungen beim indirekten Schließen sind also Stich- 
probenrealisationen, die Ergebnisse einer durchgeführten Zufallsstichprobe. 
Diese lassen sich durch Häufigkeitsverteilungen sowie durch die zugehöri- 
gen Verteilungsparameter wie x , s 2 oder p beschreiben (vgl. Abschnitt 
1.3). Die entsprechenden Grundgesamtheitsparameter /z, er 2 oder 7r, die ei- 
gentlich im Mittelpunkt unseres Interesses stehen, sind unbekannt, sollen 
jedoch aufgrund der vorliegenden Stichprobe geschätzt werden (weil sie als 
Maßzahl die Grundgesamtheitsverteilung charakterisieren oder, falls ein ge- 
wisser Verteilungstyp bereits bekannt ist, diese sogar festlegen). Bei einer 
Punktschätzung geht es dabei darum, aus den Informationen der vorliegen- 
den Stichprobe einen numerischen Wert als Schätzgröße für den unbekannten 
Parameter festzulegen. 

Bezeichnen wir den unbekannten, zu schätzenden Grundgesamtheitspa- 
rameter mit fl (^ kann also z.B. für p oder er 2 oder 7 r stehen), so geht es im 
Rahmen der Schätztheorie darum, eine Funktion g zu finden, die es erlaubt, 
für jede konkrete Stichprobenrealisation (xi, . . . , x n ) einen Schätzwert fl für 
fl festzulegen: fl = g{x \ , . . . , x n ). g soll also die in einer Stichprobe vorhande- 
nen Informationen über den unbekannten Parameter zu einem numerischen 
Schätzwert fl für fl „verdichten“. 

Faßt man eine konkrete Stichprobe vom Umfang n als Realisierung ei- 
ner Zufallsvariablen X = (Xi, . . . , X n ) auf, so definiert g(X i, . . . , X n ) eine 
neue Zufallsvariable G, und der Schätzwert fl läßt sich als Realisierung dieser 
Zufallsvariablen g{X\ , . . . , X n ) — G auffassen: man nennt G eine Schätz- 
funktion. Bezeichnet man ganz allgemein (reellwertige) Funktionen von 
Stichprobenvariablen als Stichprob enfunktionen, so besteht das Problem der 
Punktschätzung also darin, für einen unbekannten Parameter fl der Grundge- 
samtheit aus der Klasse der Stichprobenfunktionen eine geeignete Funktion 
g als Schätzfunktion auszuwählen und mit Hilfe dieser Funktion und einer 
konkret vorliegenden Stichprobe den Schätzwert fl zu bestimmen. Ob und 
inwieweit eine Schätzfunktion „geeignet“ ist, muß anhand von noch zu de- 
finierenden Gütekriterien beurteilt werden. Diese Aufgabe im Rahmen von 
Punktschätzungen soll im nächsten Abschnitt angesprochen werden. 

Im folgenden werden drei Konstruktionsverfahren für Schätzfunktionen 
dargestellt. 

a) Momentenmethode 

Die unbekannten zu schätzenden Momente der Grundgesamtheit werden 
durch die Werte der entsprechenden Momente in der Stichprobe geschätzt, 
also insbesondere: 
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• wähle X = als Schätzfunktion für den Mittelwert n der 

Grundgesamtheit ; 

• wähle P — -X als Schätzfunktion für den Anteilswert w in dichotomer 

n 

Grundgesamtheit ; 

• wähle S 2 = ^ als Schätzfunktion für die mittlere qua- 

dratische Abweichung er 2 der Grundgesamtheit. 

Die Momentenmethode benötigt also keine Informationen über den Typ 
der Grundgesamtheitsverteilung, sondern allein die Kenntnis der Stich- 
probenrealisation . 

b) Maximum- Likelihood- Methode 

Liegt eine konkrete Stichprobenrealisation (#i, . . . , x n ) vor, so wähle man 
den Wert d als Schätzwert für den unbekannten Grundgesamtheitspara- 
meter d, für den gilt: 

Die Wahrscheinlichkeit (im diskreten Fall) bzw. die Dichte (im stetigen 
Fall) für das Eintreten der beobachteten Stichprobe ist bei Vorliegen dieses 
Wertes d für d größer, oder zumindest nicht kleiner, als für alle anderen 
Werte von d. 

Ist f#(x) die vom unbekannten Parameter d abhängige Wahrscheinlich- 
keits- bzw. Dichtefunktion der Grundgesamtheitsverteilung, und sind 
a?i , . . . , x n die Realisationen der Stichprobenvariablen X\, . . . , X n in ei- 
ner konkreten einfachen Stichprobe vom Umfang n, dann gilt: 

n n 

W(Xi = X! , . . . , Xn = x n ) = JJ W(Xi = Xi) = ü U (*i) 

1=1 *= 1 

im diskreten Fall bzw. für die gemeinsame Dichtefunktion: 

n 

/(* i> • ••.*«) = 

*= i 



im stetigen Fall. 

Die Funktion LF{d) = fa( x i) heißt die Likelihoodfunktion. Die 
Maximum-Likelihood-Schätzfunktion (ML-Schätzer) erhält man im Falle 
einer differenzier baren Likelihoodfunktion und bei vorhandenen lokalen 
Maxima durch Lösen von 

±LF{d) = 0 bzw. £ln(Lf(tf)) = 0. 

Da ln(LF(t?)) = Yl?=i ist die zweite notwendige Bedin- 

gung für die Bestimmung des ML-Schätzers rechentechnisch meist einfa- 
cher zu lösen. Zur endgültigen Entscheidung, ob die Lösung der obigen 
Bedingungen tatsächlich ein ML-Schätzer ist, sind die höheren Ableitun- 
gen heranzuziehen. 
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Liegt keine einfache Stichprobe vor, so ist die Produkt- bzw. Summen- 
darstellung der Likelihoodfunktion nicht möglich. Vereinfachungen der 
Darstellung der Likelihoodfunktion kann man nicht nur in diesem Fall 
durch Übergang zu geeigneten Statistiken und deren Verteilungen errei- 
chen. 

Wir wollen dies an unserem Eingangsbeispiel „IHK-Bezirk“ veranschau- 
lichen: Die Wahrscheinlichkeit für das Eintreffen der beobachteten Stich- 
probe (50 von 100 Personen geben positive Beurteilungen ab) in Abhän- 
gigkeit vom unbekannten Grundgesamtheitsparameter 7r beträgt 

W(X = 50k) = ( 50 °) 7r50 ( 1 - = LF (*)• 

Es ist der Wert 7 r zu bestimmen, für den LF( ir) maximal ist: 

LF'(x) = 50 - *) 49 U - 2 t)] = 0 

=> 7r = 0 oder 7r = 1 oder 7r = 

Für 7r = 0 bzw. 7r = 1 ist LF(tt) aber minimal. ir = ^ ist der ML-Schätzer 
für 7T. 

Neben der Stichprobenrealisation muß zur Anwendung der Maximum- 
Likelihood-Methode (ML-Methode) außerdem der Typ der Grundgesamt- 
heitsverteilung bekannt sein. 

c) Klein st- Quadrate- Methode 

Die Kleinst-Quadrate-Methode soll hier exemplarisch anhand der Schät- 
zung von // dargestellt werden: Wähle den Schätzwert ß so, daß die 
Summe der quadrierten Abweichungen der Beobachtungen vom Schätz- 
wert minimal wird, d.h.: 



n 



Wähle ß so, daß — ß) 2 — ► min ! 

*=i 

Man erhält ß = x als Kleinst-Quadrate-Schätzfunktion (KQ-Schätzer). 



Aufgabe 3.3/1 

a) Erläutern Sie die unterschiedlichen Fragestellungen beim direkten bzw. 
beim indirekten Schließen. 

b) Erläutern Sie die Begriffe: Stichprobenvariable, Stichprobenfunktion, 

Schätzfunktion, Punktschätzung. 

c) Welche Informationen über die Grundgesamtheitsverteilung sind für die 
Anwendung der Momentenmethode bzw. der ML-Methode erforderlich? 
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d) Läßt sich aus der Grundidee der ML-Methode ein allgemeines methodi- 
sches Konzept zur Analyse konkreter gesellschaftlicher Vorgänge gewin- 
nen? 

e) Warum führen Differentiation von LF(7r) bzw. ln(LF(7r)) zur gleichen 
Schätzung d für dl 



Aufgabe 3.3/2 In einer Urne befinden sich grüne, weiße und rote Kugeln, 
und zwar doppelt so viel weiße wie grüne. Zur Schätzung des Anteils i r der 
grünen Kugeln werden 40 Kugeln mit Zurücklegen gezogen. Ergebnis: 



10 grüne, 17 weiße, 13 rote. 
Die Wahrscheinlichkeit für dieses Ereignis beträgt 



40! 

10!17!13! 



2 17 tt 27 (1 - 3;r) 13 . 



Wie groß ist der Schätzwert für w 



a) nach der Maximum-Likelihood-Methode 

b) nach der Momenten-Methode? 



Aufgabe 3.3/3 



a) 



Die Lebensdauer X gewisser elektronischer Teile genüge einer Verteilung 
mit Dichte 




für x > 0 
für x < 0 



Der Test von 5 Teilen ergebe die folgenden Lebensdauern (gemessen in 
Betriebsstunden) : 

110,100,90,140,60 



Bestimmen Sie den ML-Schätzwert von d 



al) allgemein für eine Stichprobenrealisation (a?i, . . . , x n ) (Benutzen Sie 
die log-Likelihood- Funktion!) 

a2) für die vorliegende Stichprobe, 
b) Die Dichtefunktion einer Zufallsvariablen X sei gegeben durch 




— a < x < a 
sonst 



Eine Stichprobe mit Zurücklegen vom Umfang 5 liefert die Beobachtun- 
gen: 

15,-8,12,-17,5. 

Bestimmen Sie den Maximum-Likelihood-Schätzwert für a. 
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c) Sie werfen eine Münze 12 mal und beobachten 

K, K, A, K, A, K, K, K, A, K, K, A. 

Bestimmen Sie den ML-Schätzwert für die Wahrscheinlichkeit des Auf- 
tretens von K . 



Aufgabe 3.3/4 Im „ Wohlfahr tssurvey 1988 der BRD“ sind 2147 Personen, 
darunter 1147 Frauen, zu Lebensbedingungen und zum subjektiven Wohlbe- 
finden befragt worden. Dabei erklärten 19% der befragten Frauen aber nur 
8% der befragten Männer, daß sie sich einsam fühlten. 57 Frauen und 40 
Männer fühlten sich unglücklich, geben Sie jeweils eine Punktschätzung für 

a) den Anteil der Personen in der BRD, die sich 1988 einsam fühlten, 

b) den Anteil der Frauen, bzw. Männer, bzw. Personen in der BRD, die sich 
1988 unglücklich fühlten. 



Ergänzungen und Bemerkungen 

• Eine naheliegende Verallgemeinerung der Momentenmethode ist die fol- 
gende Regel: Wähle als Schätzwert für einen beliebigen Grundgesamt- 
heitsparameter ( wie z.B. Median, Modus usw.) den entsprechenden Pa- 
rameter aus der Stichprobe (vgl. Fisz (1976), Kapitel 10). Läßt sich ein 
Grundgesamtheitsparameter als Funktion der Verteilungsmomente ange- 
ben, und schätzt man ihn durch Einsetzen der Stichprobenmomente in 
diese Funktion, so spricht man von verallgemeinerter Momentenmethode. 

• Bei der Bestimmung des ML-Schätzers ist auf mögliche Randmaxima zu 
achten. 

• ML-Schätzer erfüllen folgendes Invarianzprinzip: Ist g eine meßbare Funk- 
tion und ML-Schätzer für d, so ist fj = </($) ML-Schätzer für 7] = gfö) 
(vgl. Pruscha (1989), 1.4). 

• Der Begriff Likelihood geht auf R. A. Fisher zurück und bezeichnet 
zunächst ein relatives Maß für die Glaubwürdigkeit einer statistischen 
Aussage gegenüber einer anderen (vgl. Barnard (1990)). Ein 1912 er- 
schienener Aufsatz legte die Grundlagen zur ML-Methode. 

• Die Kleinst-Quadrate-Schätzfunktion hat ihre Bedeutung insbesondere 
für die Theorie linearer Regressionsmodelle zur Schätzung der Regressi- 
onskoeffizienten und für die darauf aufbauenden ökonometrischen Modelle 
(vgl. z.B. Bamberg/Schittko (1979), Hübler (1990)). 
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• Ein weiteres Verfahren zur Konstruktion von Schätzfunktionen erhält man 
unter Verwendung der Formel von Bayes. Liegen über den unbekannten 
Parameter d bereits vor dem Ziehen einer Stichprobe Informationen vor, 
die es gestatten, eine A-priori-Wahrscheinlichkeits- oder Dichtefunktion 
f(d) für das Vorliegen eines bestimmten Wertes von d festzulegen, so 
können diese Informationen mit denen aus der Stichprobe mittels der 
Formel von Bayes zu einer Bayes-Schätzfunktion verknüpft werden. (Vgl. 
hierzu Helten (1971) oder Bamberg/Baur (1989), Abschnitt 12.5). 



3.4 Punktschätzverfahren: Gütekriterien 

Der Mittelwert fi einer Grundgesamtheitsverteilung soll aufgrund einer Stich- 
probe durch Anwendung eines Punktschätz Verfahrens geschätzt werden. Von 
der Grundgesamtheits Verteilung sei lediglich bekannt, daß es sich um eine 
symmetrische Verteilung handelt, d.h. insbesondere, daß Erwartungswert, 
Median und Modus der Grundgesamtheit zusammenfallen. In der Stichprobe 
können jedoch alle diese drei Maßzahlen unterschiedliche Werte annehmen. 
Soll nun das arithmetische Mittel, der Median oder der Modus der Stich- 
probe als Schätzfunktion für den unbekannten Grundgesamtheitsparameter 
fi gewählt werden? Oder ist eine Schätzfunktion die alle drei Maßzahlen zu 
einer Schätzung von fi verknüpft, die geeignete? 

Fragen dieser Art lassen sich nur beantworten, wenn zuvor geeignete 
Gütekriterien für Schätzfunktionen formuliert werden. Dies soll im folgenden 
geschehen. 

a) 'Erwartung streue 

Eine Schätzfunktion G heißt erwartungstreu (unverzerrt) für d, wenn ihr 
Erwartungswert mit dem wahren Wert $ übereinstimmt (d.h. im Durch- 
schnitt soll der Schätzwert mit dem wahren Wert zusammenfallen): 

E(G) = d. 

Erwartungstreue Schätzfunktionen sind: 

• X für fi (aber auch jede Stichprobenvariable Xi ist erwartungstreu für 

/*); 

• P für 7r; 

• ‘S'n-i = ^rfZir=i(^* “ X) 2 für er 2 , wenn eine einfache Stichprobe 
vorliegt (5 2 ist nicht erwartungstreu für <r 2 ); 

• S l = £ E"=l(*i - m) 2 für <T 2 , wenn eine einfache Stichprobe vorliegt. 

Die Differenz ( E(G ) — t?) heißt Verzerrung (Bias). Sie ist offensichtlich 
für unverzerrte Schätzer gleich Null. 
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b) Asymptotische Erwartungstreue 

Wenn mit wachsendem Stichprobenumfang n der Erwartungswert einer 
Schätzfunktion G n gegen den wahren Wert d konvergiert, d.h. 

lim E(G n ) - 

n— ► oo 

so heißt G n asymptotisch erwartungstreu für d. 

S 2 ist eine asymptotisch erwartungstreue Schätzfunktion für er 2 , die nicht 
erwartungstreu ist. 

c) Effizienz (Wirksamkeit) 

Sind Gi und G2 zwei erwartungstreue Schätzfunktionen für tf, so heißt 
Gi effizienter (wirksamer) als G2, wenn gilt: 

V{Gi) < V(G 2 ). 

In diesem Fall wird Gi der Schätzfunktion G 2 vorgezogen. Eine Schätz- 
funktion G heißt effizient in einer Klasse von Schätzfunktionen, wenn sie 
erwartungstreu ist und die kleinste Varianz von allen erwartungstreuen 
Schätzfunktionen dieser Klasse für d aufweist. Beispielsweise ist X effizi- 
ent für n im Falle einer normalverteilten Grundgesamtheit. 

d) Konsistenz 

Eine Schätzfunktion G n heißt konsistent für 1?, wenn mit wachsendem n 
der von G„ erzeugte Schätzwert mit beliebig großer Wahrscheinlichkeit 
in ein vorgegebenes Intervall [tf - £, d + e] mit e > 0 (beliebig klein, aber 
fest gewählt) fällt, d.h. 



lim W{\G n -d\<e)^l 

n— ►oo 

(stochastische Konvergenz). 

Geht mit wachsendem n sowohl die Verzerrung als auch die Varianz gegen 
0 , so ist die Schätzfunktion konsistent. Zur Herleitung der Konsistenz 
einer Schätzfunktion kann auch oft die Tschebyscheffsche Ungleichung 
benutzt werden. X ist konsistent für //, S 2 und S 2 _j für er 2 . 

e) Suffizienz 

Eine Schätzfunktion heißt suffizient (erschöpfend) für 1?, wenn sie die ge- 
samte Information über den zu schätzenden Parameter, die in der vorlie- 
genden Stichprobe vorhanden ist, ausschöpft, d.h. keine Information aus 
der Stichprobe (die ja Kosten verursacht) verschenkt wird. 

Hinreichend und notwendig für die Suffizienz ist das folgende Faktorisie- 
rungskriterium nach Neyman: 

d ist suffizient für d . . . , x n ) - fi(xi , . . . , x n )f 2 } #(tf). 

X ist erschöpfend für fi\ G ^ — xm ist im Falle kardinalskalierter Daten 
nicht suffizient für pL. 
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Aufgabe 3.4/1 Beurteilen Sie, ob die folgenden Aussagen wahr oder falsch 
sind. 

a) Jede erwartungstreue Schätzfunktion ist auch asymptotisch erwartungs- 
treu. 

b) Jede effiziente Schätzfunktion ist auch asymptotisch erwartungstreu. 

c) Die Schätzfunktion ^z\S 2 ist erwartungstreu für <r 2 . 



Aufgabe 3 .4/2 



a) Zeigen Sie: X ist eine erwartungstreue Schätzfunktion für //, wenn eine 
einfache Stichprobe vorliegt. 

b) Ein Schätzer G$ )n für den unbekannten Parameter d habe beim Stichpro- 
benumfang n den Erwartungswert d + e~ n und die Varianz ^ 

der Schätzer 



bl) erwartungstreu 
b2) asymptotisch erwartungstreu 
b3) effizient 
b4) konsistent? 



c) Ist die Schätzfunktion ^ + X n 

oder asymptotisch erwartungstreu für //? 



für n > 2 erwartungstreu 



d) Zur Schätzung eines Parameters d einer bestimmten Zufallsvariablen mit 
Varianz a 2 werde ein Schätzer verwendet, der bei einem Stichprobenum- 
fang von n den Erwartungswert und die Varianz hat. Ist 

dieser Schätzer für d konsistent? 



Aufgabe 3.4/3 „Die graphoskopische Befragungsmethode läßt die Teilneh- 
mer die aktuelle Konjunkturentwicklung der jeweiligen Branche graphisch 
in die Zukunft projizieren. ...Die prognostizierten Einzelverläufe werden 
zu Branchenergebnissen und dann zu größeren Aggregaten verdichtet. Das 
Ergebnis sind sehr plastische Darstellungen des erwarteten Konjunkturver- 
laufs.“ (Ifo-Spiegel der Wirtschaft 1990/91 S. 05). Eine präzise Beschreibung 
eines Punktschätzverfahrens? Welche der o.a. Gütekriterien sind erfüllt? 



Ergänzungen und Bemerkungen 

• Zur ausführlichen Diskussion der Gütekriterien (asymptotische) Erwar- 
tungstreue, Effizienz (insbesondere die Frage nach der Existenz einer 
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wirksamsten Schätzfunktion in der Klasse aller erwartungstreuen Schätz- 
funktionen sowie die Definition einer asymptotischen Effizienz), Konsi- 
stenz (insbesondere der Begriff der stochastischen Konvergenz), Suffizienz 
(formale Definition dieses Kriteriums) sowie weiterer Gütekriterien und 
wechselseitiger Zusammenhänge dieser Kriterien bei bestimmten Voraus- 
setzungen über die Grundgesamtheitsverteilung verweisen wir auf Fisz 
(1976), Kapitel 13. Zum Konzept und zur formalen Definition der Suffi- 
zienz vgl. auch Dillmann (1990 b), Abschnitt 12. 

• Bezüglich unserer Methode der Konstruktion von Schätzfunktionen läßt 
sich allgemein sagen: Die aufgrund der Momentenmethode gewonnenen 
Schätzfunktionen sind i.a. konsistent und asymptotisch erwartungstreu. 
Die Erwartungstreue ist nicht von vornherein zu erwarten. ML-Schätz- 
funktionen sind i.a. (für große n ) effizienter als Schätzfunktionen aufgrund 
der Momentenmethode, insbesondere dann, wenn die Verteilung stark von 
der Normalverteilung abweicht. 

• Für die Schätzung der Regressionskoeffizienten in linearen Regressions- 
modellen liefert das Gauß- Mar ko ff- Theo rem das folgende Resultat: In- 
nerhalb der Klasse der linearen erwartungstreuen Schätzfunktionen für 
die Regressionskoeffizienten ist die Kleinst-Quadrate-Schätzfunktion effi- 
zient (d.h. insbesondere fi = X ist effiziente Schätzfunktion in der Klasse 
aller linearen erwartungstreuen Schätzfunktionen für /i). 

• Eine umfassende Darstellung der Diskussion von Gütekriterien, die sich 
aus entscheidungstheoretischen Überlegungen ableiten lassen, findet sich 
bei Ferguson (1967); vgl. zu dieser Sichtweise auch Dillmann (1990) oder 
Marinell/Seeber (1991). 

• In einer Reihe von Studien wird auf das Problem der Robustheit von 
Schätzfunktionen eingegangen: wie verändern sich die Eigenschaften einer 
Schätzfunktion, wenn gewisse Voraussetzungen über die Grundgesamt- 
heitsverteilung, unter denen bestimmte Güteeigenschaften für die aus- 
gewählte Schätzfunktion nachgewiesen werden können, nur annähernd 
erfüllt sind oder mehr oder weniger verletzt sind? Vgl. z.B. Hampel 
(1980) oder Huber (1981). 

3.5 Intervallschätzung für Mittel- bzw. An- 
teilswerte 

Betrachten wir noch einmal unsere Beispiele „Studentenbefragung“ und 
„IHK-Bezirk“ (vgl. Abschnitt 3.3). Wir fragen jetzt nach einem Schätz- 
verfahren, das es erlaubt, aufgrund einer einfachen Stichprobe vom Umfang 
n die Grenzen eines Intervalls festzulegen, das den wahren Wert des Grundge- 
samtheitsparameters // (bzw. 7 r) enthalten soll. Da die zu bestimmenden In- 
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tervallgrenzen von den zufällig in die Stichprobe gelangten Merkmalsträgern 
(statistischen Einheiten) abhängen (d.h. die Grenzen sind Stichprobenfunk- 
tionen), kann nur mit einer bestimmten Wahrscheinlichkeit erwartet werden, 
daß das konstruierte Intervall den wahren Parameterwert auch tatsächlich 
enthält. Unsere Feststellung läßt sich also wie folgt präzisieren: 

Läßt sich ein Schätz verfahren angeben, das aufgrund einer Stichprobe 
vom Umfang n eine Intervallschätzung für den unbekannten Grundgesamt- 
heitsparameter n (bzw. 7r) liefert, wobei die Wahrscheinlichkeit dafür, daß 
das so konstruierte Intervall den wahren Parameterwert einschließt, einem 
vorgegebenen Wert 1 — a entspricht? 

Ein so konstruiertes Intervall nennt man ein Konfidenzintervall (oder 
Vertrauensbereich) für den unbekannten Grundgesamtheitsparameter, und 
die Wahrscheinlichkeit 1 — a bezeichnet man als Konfidenzniveau (auch Si- 
cherheitsgrad oder Aussagesicherheit). 

Die Wahrscheinlichkeit a, daß das Schätz verfahren ein Intervall liefert, 
das den wahren Wert des Grundgesamtheitsparameters nicht enthält, heißt 
Irrtumswahrscheinlichkeit . 



3.5.1 Heterograde Fragestellung 

Nach Abschnitt 3.2 gilt für die Stichprobenverteilung von X , daß 

X~NV(fi,*x), 

falls X bereits normal verteilt ist, wobei 

_/ 7^ für Z.m.Z. 

°* 1 7S\/Si? Z» Z 

Ist X nicht normalverteilt, so gilt diese Verteilung für X zumindest appro- 
ximativ, falls n > 30 (bei kleinem Auswahlsatz gilt yj «1). In beiden 
Fällen erhält man also: 

Wir setzen $(/) = 1 — a. Um die Abhängigkeit von der Wahl von a zu 
verdeutlichen, bezeichnen wir den entsprechenden t - Wert mit t a \ 

$(t a ) = 1 - a. 

Durch Umformung erhält man 

W {X — t a <7x ^ 5^ X ta&x') ~ 1 — a 

und schließlich durch Vorgabe eines entsprechenden Konfidenzniveaus 1 — a 
(bzw. einer Irrtumswahrscheinlichkeit a) das gesuchte Konfidenzintervall für 
M- 



[X ~ t a (TxiX 4- tafTx]. 
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Diese Konstruktion des symmetrischen Konfidenzintervalls setzt zunächst die 
Kenntnis der Grundgesamtheitsvarianz er 2 voraus. 

Ist a 2 unbekannt, läßt sich zumindest im Falle großer Stichproben 
( n > 30) mit Hilfe der Normalverteilung ein Konfidenzintervall konstruieren: 
Dazu schätzt man den unbekannten Grundgesamtheitsparameter a 2 durch 
die Stichprobenvarianz S 2 _ x = — X) 2 . Diese Schätzfunktion 

ist erwartungstreu, und die Zufallsgröße 






ist näherungsweise standardnormalverteilt. 

~ ta ^7Z~'X + 

liefert ein approximatives Konfidenzintervall für fi bei unbekanntem er im 
Falle großer Stichproben. Liegt Z.o.Z. vor und ist der Auswahlsatz klein, 
muß der Korrekturfaktor berücksichtigt werden. 

Liegt eine konkrete Stichprobe vor, so erhält man also durch Einsetzen 
der Realisationen x und s n _i der entsprechenden Zufallsvariablen X und 
5 n _i eine Intervallschätzung für den unbekannten Grundgesamtheitspara- 
meter fi. 

Für unser Beispiel „Studentenbefragung“ ergibt sich (bei a = 0.05): 

[884.15,895.85]. 

Konfidenzintervalle für fi sind symmetrisch um X. Ist er bekannt, so 
hängt die Länge des Konfidenzintervalles bei einer einfachen Stichprobe von 
a und dem Stichprobenumfang n ab. Bezeichnet man mit 



e = t a 



y/n 



die halbe Länge des Intervalles, so ist e ein Maß für die Schätz(un)genau- 
igkeit. Mit zunehmendem Stichprobenumfang und/oder zunehmender Irr- 
tumswahrscheinlichkeit wird e c.p. kleiner. Gibt man die zulässige absolute 
Abweichung e vor, so läßt sich aus obiger Formel der erforderliche Stichpro- 
benumfang n* berechnen: 




Ist a unbekannt, so hängt e noch von der Zufallsvariablen S 2 _ x ab und n* 
läßt sich nicht bestimmen. In der Praxis behilft man sich in diesem Fall 
wie folgt: man zieht eine kleine Vorstichprobe, um a 2 zu bestimmen, und 
berechnet n* mit <7 2 statt mit er 2 . 
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3.5.2 Homograde Fragestellung 

Der Anteilswert P einer Stichprobe vom Umfang n ist nach Abschnitt 3.2 
approximativ normalverteilt mit dem Mittelwert i r und der Varianz 7r( > 1 ~ 7r ) 
(für Z.m.Z. oder kleinen Auswahlsatz bei Z.o.Z.) bzw. (für Z.o.Z. 

mit großem Auswahlsatz). Das gilt jedenfalls dann, wenn n genügend groß 
gewählt wurde: n7r(l — tt) > 9. Aus 



W{-t Q < } ?-r Tr < t Q ) = *(ta) = 1 - * 

\/7r(l -v)/n 

erhält man das Konfidenzintervall: 

P-t a ^^,P + t a yß^ . 

Den unbekannten Grundgesamtheitsparameter 7 r in der Formel der Varianz 

ersetzt man bei Vorliegen einer einfachen Stichprobe durch den Schätzwert 

7r — p, so daß man als approximative Intervallschätzung schließlich erhält: 

Konfidenzintervalle für 7 r sind symmetrisch um P. Die Länge des Konfidenz- 

intervalles hängt hier in jedem Fall von der Zufallsvariablen P ab. 

Aufgabe 3.5/1 

a) Diskutieren Sie folgende Aussage: „Die Wahrscheinlichkeit 1 — a gibt an, 
mit welcher Wahrscheinlichkeit der unbekannte Grundgesamtheitspara- 
meter einen Wert annimmt, der innerhalb des Konfidenzintervalls liegt/ 4 

b) Wie läßt sich die Genauigkeit einer Intervallschätzung vergrößern? Dis- 
kutieren Sie die Gütekriterien „Aussagesicherheit“ und „Aussagegenauig- 
keit“ einer Intervallschätzung. 

c) Kommentieren Sie:,, Um die Schätzgenauigkeit bei gleicher Aussagesicher- 
heit zu verdoppeln, muß man den Stichprobenumfang vervierfachen.“ 

d) Zur Festlegung des Stichprobenumfangs im homograden Fall wird wegen 
Unkenntnis des Parameters 7r oft vorgeschlagen, 7 r = 0.5 in der entspre- 
chenden Formel zu setzen. Warum? 

e) Worin kommt der Zufallscharakter des Konfidenzintervalls zum Aus- 
druck? 

f) Die Größe a/y/n wird auch als Standardschätzfehler bezeichnet und ihr 
Wert als Gütekriterium für Punktschätzungen für p verwendet. Was mei- 
nen Sie dazu? 
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Aufgabe 3.5/2 

a) Eine Untersuchung der Schülerzahlen in Klassen nach Schulformen ergab 
für 1976 eine durchschnittliche Klassenstärke von 29.4 Schülern in 100 un- 
tersuchten Grund- und Hauptschulen. Geben Sie eine Intervallschätzung 
(a = 0.05) für die durchschnittliche Klassenstärke in Grund- und Haupt- 
schulen, wenn s 2 ^ = 100 beträgt. 

b) Wie ändert sich das Ergebnis in a), wenn der Untersuchung nur 25 Schulen 
zugrunde liegen? Welche zusätzliche Voraussetzung muß jetzt gemacht 
werden? 

c) Mit welchem Sicherheitsgrad kann aufgrund der Stichprobe in a) behaup- 
tet werden, daß die durchschnittliche Klassenstärke in Grund- und Haupt- 
schulen zwischen 26.4 und 32.4 liegt? 



Aufgabe 3.5/3 Auf die Frage „Welcher Partei würden Sie Ihre Stimme ge- 
ben, wenn am nächsten Sonntag Bundestagswahl wäre?“ antworten 20 von 
100 Befragten „der Partei XYZ“. Geben Sie eine Schätzung für den Stim- 
menanteil der Partei XYZ bei einem Konfidenzniveau von 0.90. 



Aufgabe 3.5/4 In den Städten A und B mit jeweils 20000 Wohnungen soll 
durch eine Stichprobe die jeweilige durchschnittliche Wohnungsgröße ermit- 
telt werden. Zu diesem Zweck werden sowohl in A als auch in B 100 Woh- 
nungen zufällig ausgewählt. 

a) Berechnen Sie ein 95.5%- Konfidenzintervall für die tatsächliche durch- 
schnittliche Wohnungsgröße in A, wenn die Stichprobe eine durchschnitt- 
liche Wohnungsgröße von 75m 2 bei einer Varianz von 121 ergab. 

b) Für die tatsächliche durchschnittliche Wohnungsgröße in Stadt B wurde 
[68.4,71.6] als Intervallschätzung bei einem Konfidenzniveau von 95.5% 
ermittelt. Welche Grundgesamtheitsvarianz wurde bei dieser Berechnung 
unterstellt? 



Aufgabe 3.5/5 Bei der Intervallschätzung des Mittelwertes einer Zufalls- 
variablen X mit bekannter Varianz betrage die Aussagegenauigkeit gerade 
e = 3.92 bei einer Aussagesicherheit von 95%. Welche Aussagegenauigkeit 
ergibt sich für eine Aussagesicherheit von 99%? 



Aufgabe 3.5/6 Der „Paderborner Datensatz“ enthält empirische Daten zu 
38272 Beschäftigungsverhältnissen im öffentlichen Dienst für den Zeitraum 
1970-1980 (vgl. Brandes u.a. (1990)). Von 1806 Männern und 652 Frauen, 
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die während des. gesamten Untersuchungszeitraumes in einer Arbeitsstelle 
des öffentlichen Dienstes tätig waren, erfuhren 451 Männer und 366 Frauen 
keine Beförderung in diesem Zeitraum (Kraft (1990), S. 297). Bestimmen Sie 
jeweils eine Intervallschätzung für den Anteil der Aufsteiger („Mover“) unter 
den Männern und Frauen (a=0.1) und interpretieren Sie das Ergebnis. 



Ergänzungen und Bemerkungen 

• Der Begriff des Konfidenzintervalls wurde von J. Neyman (1894-1981) in 
den Dreißiger Jahren dieses Jahrhunderts eingeführt. 

• Die Grenzen der mit Hilfe der Normalverteilung gewonnenen Konfidenz- 
intervalle für einen Grund gesamtheitsparameter d weisen folgende Struk- 
tur auf: G$ ± t a y/V(Gti) wobei G$ eine erwartungstreue und suffiziente 
Schätzfunktion für d ist. 

• Für Z.o.Z. läßt sich ebenfalls eine Formel zur Bestimmung des notwen- 
digen Stichprobenumfangs ableiten. Bei kleinem Auswahlsatz können al- 
lerdings die Formeln für einfache Stichproben verwendet werden; sie sind 
dann jedenfalls näherungsweise gültig. Die Formeln sind nicht nur zur 
genauen Bestimmung des erforderlichen Stichprobenumfangs unter den 
angegebenen Voraussetzungen interessant; sie weisen insbesondere auf die 
Größen hin, die bei der Festlegung eines Stichprobenumfangs überhaupt 
zu berücksichtigen sind. Je heterogener die Grundgesamtheit, je siche- 
rer und genauer die Aussage sein soll, desto höher ist der erforderliche 
Stichprobenumfang. 

• Die hier betrachteten Verfahren zum Punkt- bzw. Intervallschätzen be- 
zogen sich alle auf das Schätzen einzelner Parameter der Grundgesamt- 
heitsverteilung. Eine umfangreiche Literatur befaßt sich darüber hinaus 
mit dem Schätzen ganzer Verteilungen. So finden sich in Fisz (1976), Ab- 
schnitt 13.8, Hinweise für die Konstruktion von Konfidenzintervallen für 
die Verteilungsfunktion F(x). 



3.6 Intervallschätzungen für die Varianz 

Bei einer Reihe von empirischen Untersuchungen steht weniger der Mittel- 
wert der Grundgesamtheit als vielmehr der Streuungsparameter er 2 im Vor- 
dergrund des Interesses (so z.B. bei der Frage nach der Höhe der Wechsel- 
kursschwankungen). Anknüpfend an die Vorgehensweise im letzten Abschnitt 
suchen wir nun nach einer Möglichkeit, Konfidenzintervalle für die Grundge- 
samtheitsvarianz er 2 zu bestimmen. Hierzu benötigt man zunächst die Kennt- 
nis der Verteilung der Stichprobenvarianz 5 2 _ 1? die wir in Abschnitt 3.4 als 
erwartungstreuen Schätzer für <t 2 kennengelernt haben. 
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Betrachten wir nun die Stichprobenfunktion 



0 




2 



Ist die Grundgesamtheit normalverteilt und zieht man eine einfache Stichpro- 
be, so erfüllt zunächst ]T^ =1 (Xt — /z) 2 /<r 2 a ^ e Voraussetzungen einer x 2 V( n )- 
verteilten Zufalls variablen, wie sie in Abschnitt 2.12 angeführt wurden. Wei- 
ter läßt sich zeigen, daß die Größe — X) 2 /cr 2 x 2 V(n — l)-verteilt ist 

(ein Freiheitsgrad geht durch die Schätzung von /z durch X „verloren“). Mit 
Hilfe der tabellierten x 2 -Werte und der Vorgabe einer Irrtumswahrscheinlich- 
keit a läßt sich nun das gewünschte Konfidenzintervall für er 2 bei Vorliegen 
einer Stichprobe vom Umfang n bestimmen: 

Bezeichnet man mit xj>,v das p-Fraktil der x 2 V(z/)- Verteilung dann 
erhält man 

W(xll2 , n - 1 < (n ~T n -' < Xl-«/ 2 ,„-l) = 1 " « 

und hieraus das Konfidenzintervall 



(n — ^ ^ (« — l)5j_i 

—5 (7 v — 5 

^l-o/2,n-l ^-Of/2, n— 1 



Der Zähler der Intervallgrenzen kann auf folgende Arten dargestellt werden: 



(" - l)^-i = nS 2 = £(*,- ~ Xf. 

1=1 



Für eine konkrete Stichprobe erhält man also durch Einsetzen von eine 
Intervallschätzung für <r 2 , ohne die Kenntnis von Grundgesamtheitsparame- 
tern voraussetzen zu müssen. Ist /z bekannt, so sollte man anstelle der 
Stichprobenfunktion (n — l)5 2 _ x die x 2 V(n)- verteilte Stichprobenfunktion 
Sr=i(^* “ ß) 2 verwenden. 



Aufgabe 3.6/1 

a) Welche Voraussetzungen müssen erfüllt sein, um auf dem beschriebenen 
Weg zu einer Intervallschätzung für die Grundgesamtheitsvarianz zu ge- 
langen? 

b) Wie würden Sie bei der Intervallschätzung für er 2 Vorgehen, wenn /z be- 
kannt wäre? 

c) Geben Sie für das Beispiel „Studentenbefragung“ aus Abschnitt 3.3 eine 
Intervallschätzung für die Grundgesamtheitsvarianz (a = 0.1). 
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Aufgabe 3.6/2 Eine Untersuchung der Verteilung der Einkommen für weib- 
liche Angestellte ergibt für das Jahr 1972 ein durchschnittliches Bruttoein- 
kommen von 1230 bei s n _i = 400. Bei den männlichen Angestellten betrug 
zur gleichen Zeit das durchschnittliche Bruttomonatseinkommen 2030 bei 
= 592900. 

a) Geben Sie eine Intervallschätzung für die Grundgesamtheitsvarianz der 
Einkommensverteilung aller weiblichen Angestellten, wenn bei der oben 
angeführten Untersuchung 101 weibliche Personen befragt wurden (a = 
0.1). 

b) Geben Sie eine entsprechende Intervallschätzung für die Grundgesamt- 
heitsvarianz der Einkommen der männlichen Angestellten, wenn auch hier 
n = 101 betrug. 

c) Welche Schlüsse lassen sich aus dem Vergleich der beiden Intervallschät- 
zungen ziehen? Welche Voraussetzung wurde dabei unterstellt? 



Aufgabe 3.6/3 

a) Für Banken und exportorientierte Unternehmen ist die wöchentliche 
Streuung der Devisenkurse wichtiger Währungen eine interessante Größe. 
In einer Woche des ersten Halbjahres 1989 sind bei der Devisenbörse in 
Frankfurt beim „Fixing“ folgende Bewertungen des US-Dollars festgelegt 
worden (gerundet): 

2.01,2.00,1.99,1.98,2.02. 

Bestimmen Sie die Grenzen einer Intervallschätzung für die Varianz des 
Dollarkurses (Aussagesicherheit 0.95). 

b) Aus den Bewertungen für den französischen Franc für die gleiche Woche 
wurde von der Ausländsabteilung einer Bank das Intervall [0.0002, 0.0028] 
als Intervallschätzung für die Varianz des Franc-Kurses errechnet. Be- 
stimmen Sie eine Punktschätzung für die Varianz des Franc-Kurses 
aus diesen Angaben, wenn ein Konfidenzniveau von 0.90 bei der Inter- 
vallschätzung angenommen wird. 



Aufgabe 3.6/4 Es soll eine Intervallschätzung der Varianz <t 2 einer Zufalls- 
variable X durchgeführt werden. Eine Stichprobe vom Umfang 10 habe eine 
Varianz s 2 =57. Bestimmen Sie das Schätzintervall von er 2 und nennen Sie 
die Voraussetzungen für die Gültigkeit der Schätzung (a=0.5). 

Ergänzungen und Bemerkungen 

• Das in diesem Abschnitt beschriebene Schätz verfahren ist nur anwendbar, 
wenn eine normalverteilte Grundgesamtheit vorliegt. 

• Das Konfidenzintervall für <r 2 ist nicht symmetrisch um 
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3.7 Grundlagen der Testtheorie 

Im Rahmen der Schätztheorie ging es darum, allein aus Stichprobeninfor- 
mationen numerische Werte bzw. Intervalle als Schätzungen für unbekannte 
Grundgesamtheitsparameter (oder für die Verteilung selbst) festzulegen. In 
der Praxis liegen jedoch sehr oft Vermutungen — aufgrund von Erfahrun- 
gen oder theoretischen Überlegungen — über einen im Prinzip unbekannten 
Grundgesamtheitsparameter (oder über die Verteilung selbst) vor dem Zie- 
hen einer Stichprobe bereits vor. Eine solche Annahme über die Verteilung 
der Grundgesamtheit nennt man statistische Hypothese. Verfahren, die es er- 
lauben, eine statistische Hypothese durch Stichprobenbefunde zu überprüfen, 
heißen statistische Tests oder kurz Tests. Soll dabei geprüft werden, ob ein 
vorliegendes Stichprobenergebnis klar ( signifikant ) gegen die aufgestellte sta- 
tistische Hypothese ( Nullhypothese Ho) spricht, so spricht man von einem 
Signifikanztest. Tests dieser Art sollen im folgenden untersucht werden. 

Hinsichtlich der Hypothesen unterscheidet man folgende Test verfahren: 



Hypothesen 


Tests 


Parameter hypothesen : 

Annahmen über Verteilungsparameter 
wie //, er 2 oder 7r 


Parametertests 


Verteilungshypothesen : 

Annahmen über die Verteilungsklasse 
z.B. Normalverteilungsannahme 


Anpassungstests 
(Goodness-of-fit Tests) 


Homogenit ätshypothesen : 

Mehrere Verteilungen stammen aus 
der gleichen Gesamtheit 


Homogenit ätstests 


U nabhängigkeitshy pothesen : 
Mehrere Zufallsvariablen sind 
statistisch unabhängig 


U nabhängigkeitstests 



Prinzipiell sind folgende Schritte bei der Konstruktion und Durchfüh- 
rung eines Test Verfahrens zu unterscheiden: 

• Formulierung der Hypothese(n): 

Die zu prüfende Annahme oder Behauptung über die Grundgesamtheits- 
verteilung ist unabhängig von einer etwa bereits vorliegenden Stichpro- 
benrealisation als Nullhypothese Ho festzulegen. Ist auch eine Alterna- 
tivhypothese aufgrund der Aufgabenstellung formulierbar, so bezeichnet 
man diese mit H\. Dabei ist darauf zu achten, daß die Hypothese, deren 
fälschliche Verwerfung die unangenehmeren Konsequenzen aufweist, als 
Nullhypothese festgelegt wird. 

• Festlegung einer geeigneten Prüfgröße (Testfunktion) : 

Dabei handelt es sich um eine für die Hypothesenüberprüfung geeignete 
spezielle Stichprobenfunktion, die die gesamte für die Testentscheidung 
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(Verwerfung oder Beibehaltung von Ho) relevante Information aus der 
Stichprobe enthalten muß (suffiziente Statistik) und deren Verteilung bei 
Gültigkeit von Ho bekannt ist. 

• Festlegung des Verwerfungsbereichs (kritischen Bereichs) durch Vorgabe 
des Signifikanzniveaus a: 

Das Signifikanzniveau a ist die Wahrscheinlichkeit dafür, daß Ho verwor- 
fen wird, obgleich Ho zutrifft. Diese Fehlentscheidung ( Fehler 1 . Art ) 
ist aufgrund des zufälligen Charakters der Stichprobe nicht auszusch- 
ließen. Der Verwerfungsbereich V, der Wertebereich der Prüfgröße, der die 
signifikant von Ho abweichenden Realisationen der Testfunktion umfaßt 
(bei denen Ho verworfen wird), muß also so konstruiert werden, daß die 
Prüfgröße bei Gültigkeit von Ho mit Wahrscheinlichkeit a in V fällt. Diese 
Wahrscheinlichkeit läßt sich berechnen, da die Verteilung der gewählten 
Prüfgröße unter Ho ja als bekannt vorausgesetzt wird. In der Praxis wer- 
den für diese Fehlerwahrscheinlichkeit je nach der Bedeutung der Konse- 
quenzen Werte von 0.1, 0.05 oder 0.01 angenommen. In der statistischen 
Entscheidungstheorie (Kapitel 5) wird der Wert von a anhand der Be- 
wertungen der Konsequenzen ermittelt. 

Neben dem Fehler 1. Art ist noch eine weitere Fehlentscheidung bei dem 
gewählten Vorgehen möglich: man behält Ho bei, obwohl Ho falsch ist. 
Dieser Fehler, Fehler 2. Art genannt, läßt sich nur für den Fall, daß auch 
H i die Verteilung der Prüfgröße eindeutig festlegt (einfache Hypothesen, 
keine zusammengesetzten Hypothesen), kontrollieren und die zugehörige 
Wahrscheinlichkeit ß bei der Festlegung des Verwerfungsbereichs berück- 
sichtigen. Im allgemeinen ist dies aber so nicht möglich. Informationen 
über /?, soweit bekannt, können zur näheren Bestimmung des Verwer- 
fungsbereiches oder des zu wählenden Stichprobenumfangs herangezogen 
werden, wobei jedoch die Fehlerwahrscheinlichkeit a nicht überschritten 
werden darf. 

Das Komplement des Verwerfungsbereichs heißt Nicht- Ablehnungsbe- 
reich. Er ist durch die kritische(n) Grenze(n) vom Verwerfungsbereich 
getrennt. 

• Testentscheidung: 

Liegt der realisierte Wert der Prüfgröße im Verwerfungsbereich, so wird 
Ho verworfen; liegt er im Nicht-Ablehnungsbereich, so wird Ho beibehal- 
ten. Beachten Sie: 

Die Testentscheidung liefert kein Urteil darüber, ob Ho wahr oder falsch 
ist: geprüft wird nur die Verträglichkeit der beobachteten Stichprobenre- 
alisation mit der Nullhypothese. 

Die den Signifikanztests zugrundeliegende Idee soll anhand eines Beispiels 
für einen Parametertest verdeutlicht werden: Ein Lieferant gibt an, daß die 
von ihm gelieferten Packungen (Massengüter) durchschnittlich 200g enthal- 
ten. Aufgrund des Herstellungsverfahrens kann von einem normal verteilten 
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Gewicht der Packungen sowie von einer Standardabweichung von 40g ausge- 
gangen werden. Die Behauptung des Lieferanten über das Durchschnittsge- 
wicht der Packungen wird durch eine Stichprobe vom Umfang n— 100, die ein 
durchschnittliches Packungsgewicht von 190g ergibt, überprüft. Ist die Ab- 
weichung des Stichprobenergebnisses x = 190 von der Lieferantenbehauptung 
fi = 200 als zufällig oder als signifikant zu betrachten (a = 0.05)? 

• Der erste Schritt eines Testverfahrens besteht in der Ausformulierung der 
zur Untersuchung anstehenden Nullhypothese H o, in unserem Falle also: 



H o : /i = 200. 



Bezeichnen wir mit 0 die Menge der möglichen Parameterwerte (0 C R) 
und mit ©o den Nullhypothesenbereich, also die Werte aus 0, die der 
Nullhypothese zugrundeliegen (in unserem Fall ist ©o die einelementige 
Menge {200}), so läßt sich formal die Alternativhypothese mit dem Al- 
ternativhypothesenbereich ©i = 0 \ ©o bilden. Für 0 = R erhält man 
also: 

H x : /z ^ 200. 

Während die Nullhypothese in unserem Beispiel auf der Behauptung des 
Lieferanten beruht, die wir aufgrund einer Stichprobe überprüfen wollen, 
stellt H i lediglich die formale Alternative dar. 

• Ein erwartungstreuer Schätzer (und suffiziente Statistik) für fi ist X . 
Unter Gültigkeit von Hq gilt: 

X ~ NV(fi, ax) mit = no = 200, o* = 4 . 

Eine zu X äquivalente Prüfgröße ist: 

T = * ~ /i ° ~ W(0,1). 

• Da die Stichprobe aufgrund einer Zufallsauswahl zustande kam, ist nicht 
zu erwarten, daß auch bei Zutreffen der Nullhypothese fi — 200 das Stich- 
probenergebnis in jedem Fall x = 200 lautet (Einfluß des Stichproben- 
fehlers und der Grundgesamtheitsvarianz <7 2 auf das Stichprobenergebnis 
muß beachtet werden), d.h. eine kleine Abweichung des Stichprobener- 
gebnisses x von der Annahme über fi ist nicht von vornherein ein Anlaß 
zur Verwerfung von Hq. Erst wenn der Stichprobenmittelwert x „sehr 
stark“ nach oben oder nach unten vom Nullhypothesenwert ab weicht — 
wenn also die Wahrscheinlichkeit für das Auftreten der beobachteten 
Stichprobe oder von Stichproben, für die die Realisation von X noch 
weiter von /io entfernt ist, unter der Voraussetzung der Gültigkeit von Hq 
sehr klein ist — soll von einer signifikanten Abweichung gesprochen und 
Hq verworfen werden. Als Nicht- Ablehnungsbereich kommt deshalb ein 
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symmetrisches Schwankungsintervall um ßo mit den kritischen Grenzen 
Xk = /io ± t Q (r/y/n in Frage. Für a = 0.05 ist t Q = 1.96 und mit den 
Daten des Beispiels ergibt sich das Intervall [192.16,207.84] als Nicht- 
Ablehnungsbereich, bzw. (-oo, 192.16) U (207.84, +oo) als Verwerfungs- 
bereich von Ho für die Prüfgröße X . Für T sind die beiden kritischen 
Grenzen tk = (xk — Ho)/<?x — und somit ergibt sich als kritischer 
Bereich für T: (— oo, —t Q ) U (t Ql +oo). 

♦ Für den realisierten X -Wert in der vorliegenden Stichprobe gilt 

x r = 190 g [192.16,207.84]. 

Folglich ist Ho zu verwerfen. Anders formuliert, liegt der realisierte t- 
Wert t r = ? 00 = -2.25 nicht in [-1.96, 1.96] und Ho ist zu verwerfen. 

Graphisch stellt sich das Verfahren wie in Abbildung 3.1 dar. Wie Abbil- 




Abbildung 3.1: Test Verteilung mit Verwerfungsbereich 

düng 3.1 zeigt, zerfällt der Verwerfungsbereich von Ho in zwei disjunkte 
Teilmengen. Man spricht in diesem Falle von einem zweiseitigen Test. 



Aufgabe 3.7/1 

a) Erläutern Sie die folgenden Begriffe: Test, statistische Hypothese, Signi- 
fikanzniveau, Verwerfungsbereich von Ho, Fehler 1. Art, Fehler 2. Art. 

b) Prüfen Sie folgende Aussagen: 

♦ \ — a — ß. 
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• Durch einen kleinen Stichprobenumfang gewährleistet man, daß 
Ho beibehalten wird. 

• Je größer a, desto kleiner ß (ceteris paribus). 

• Je größer n, desto kleiner ß (ceteris paribus). 



Aufgabe 3.7/2 Die Lebensdauer eines Maschinenteils eines bestimmten 
Typs sei normalverteilt (a 2 = 4000000). Vom Lieferanten werde eine durch- 
schnittliche Lebensdauer von 24000 Arbeitsstunden angegeben. Die durch- 
schnittliche Lebensdauer der 100 in einem Betrieb eingesetzten Maschinen- 
teile dieses Typs wurde mit 22900 festgestellt. 

a) Testen Sie, ob diese Erfahrungen die Angaben des Lieferanten stützen 
(1 - a = 0.9545). 

b) Welcher Fehler könnte bei Ihrer Testentscheidung aufgetreten sein? Läßt 
sich die Wahrscheinlichkeit dafür ermitteln? Welche konkreten Folgen 
ergäben sich aus einer solchen Fehlentscheidung? 



Aufgabe 3.7/3 Der durchschnittliche Preis eines bestimmten Produktes lag 

im letzten Jahr bei 100.00 DM (a 2 = 100). 

a) Läßt sich diese Angabe auch für dieses Jahr aufrechterhalten, wenn Nor- 
malverteilung der Preise unterstellt wird und eine Testkaufserie der Stif- 
tung Warentest von 100 Stücken dieser Ware in diesem Jahr einen Durch- 
schnittspreis von 101.50 DM ergab (a = 0.05)? 

b) Würde sich die Testentscheidung in a) ändern, wenn der Stichprobenum- 
fang 400 bei gleichem Stichprobenergebnis gewesen wäre? 

c) Welchen Einfluß hat eine Veränderung von a auf die Testentscheidung? 



Aufgabe 3.7/4 Im Jahre 1989 kamen im Durchschnitt auf je 100000 Ein- 
wohner der BRD 241.6 hauptberuflich tätige Ärzte (Statistisches Bundesamt, 
Jahrbuch 1990, S. 662). Anfang 1990 übten in NRW 45000 Ärzte ihren Beruf 
aus (Landesamt für Datenverarbeitung und Statistik NRW (1991), S. 28). 
Weicht die Ärztedichte in NRW signifikant von den Zahlen 1989 in der BRD 
ab, wenn eine Bevölkerung von 17.4 Millionen für NRW und eine Varianz von 
4900 für die BRD unterstellt wird (a=0.05)? Schlußfolgerungen? 



Ergänzungen und Bemerkungen 

• Die hier präsentierte Vorgehensweise wird nach ihren Begründern Ney- 
man-Pearöon-Testtheorie genannt. 
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• Durch die Vorgabe von a ist das Testverfahren darauf ausgerichtet, Ho zu 
verwerfen. Sollte man Ho aufgrund einer Stichprobe nicht verwerfen, so 
könnte der Grund dafür sein, daß Ho tatsächlich richtig ist, oder daß die 
Realisation der Prüfgröße aufgrund der konkret vorliegenden Stichprobe 
eine Verwerfung von Ho nicht erlaubt. 

• In konkreten empirischen Untersuchungen empfiehlt es sich, nicht nur den 
festgelegten Wert von a sowie die Testentscheidung anzugeben, sondern 
auch die Wahrscheinlichkeit für den Fehler 1. Art, wenn der beobachtete 
Wert der Prüfgröße genau die (bzw. eine) kritische Grenze des Ableh- 
nungsbereichs wäre (tatsächliches Signifikanzniveau): Jeder Wert größer 
als diese Wahrscheinlichkeit hätte zur Verwerfung von Ho geführt. Der 
Leser der empirischen Untersuchung kann sich so einfacher ein Urteil über 
die „Glaubwürdigkeit“ der Testentscheidung machen. 

• Hinzuweisen ist auf die Unterscheidung zwischen „statistischer Signifi- 
kanz“ und „praktischer Relevanz“: So kann eine kleine Abweichung des 
Stichprobenmittelwertes von dem in der Nullhypothese festgelegten Wert 
des Grundgesamtheitsmittelwertes bei großem Stichprobenumfang „stati- 
stisch signifikant“ sein, d.h. zur Ablehnung von Ho führen, ohne auch von 
„praktischer Relevanz“ zu sein. Bei kleinem Stichprobenumfang können 
andererseits „praktisch relevante“ Abweichungen statistisch als „nicht si- 
gnifikant“ erscheinen. 

• Sind Ho und H\ konkurrierende Annahmen über die Grundgesamtheits- 
verteilung, die jeweils durch eine Theorie gestützt werden, und soll Ho 
gegen H\ getestet werden, so spricht man auch von einem Alternativ- 
test. Signifikanztests im engeren Sinne sind dann solche, bei denen eine 
Annahme (Ho) geprüft werden soll (vgl. dazu Rinne/Ickler (1986), Kap. 
9/10). 



3.8 Signifikanztests für Mittel- bzw. Anteils- 
werte 

In diesem Abschnitt sollen Mittelwertetests im Einstichprobenfall systema- 
tisch dargestellt werden. 



3.8.1 Heterograde Fragestellung 

Man unterscheidet die folgenden Hypothesenpaare: 

(i) H 0 : ß - ß o H i : ß ^ ß 0 

(ii) Ho : ß - ßo H i : ß > ßo 

oder ß < ßo 
H 0 : ß — ßo H i : 

oder ß > ßo 



(iü) 



H< Ho 
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Dabei steht /io jeweils für einen festen Zahlenwert. 

• Unterstellen wir zunächst eine normal verteilte Grundgesamtheit und eine 
bekannte Grundgesamtheitsvarianz <r 2 . 

Setzt man das Signifikanz niveau a fest, so lassen sich in allen drei Fällen 
die Grenzen des Verwerfungsbereichs mit Hilfe der NV( 0, 1)-Tabellen be- 
stimmen (/-Werte werden aus der $(Z)-Tabelle 2 im Anhang entnommen) 
und man erhält als kritische Bereiche jeweils: 

(i) (-00, /io - t a (Tx) u (/io + t a (Tx , +oo) 

(ii) (/io + t 2 a<7x > + 00 ) 

(Üi) (- 00 , /io -t 2 a<Tx) 

Den Fall (i) bezeichnet man als zweiseitigen Test, die Fälle (ii) und (iii) 
als einseitige Tests; genauer, im Falle (ii) spricht man aufgrund der Lage 
des kritischen Bereichs vom rechtsseitigen, im Falle (iii) vom linksseitigen 
Mittelwerttest. Um W(Fehler 1. Art) < a sicherzustellen, ist dabei für 
gegebenes Signifikanzniveau a der Wert t^a zur Berechnung der kritischen 
Grenzen zu verwenden. 

Eine einfache Prüfung, ob der beobachtete Wert x der Stichprobe im 
Verwerfungsbereich liegt, führt zur Verwerfung von Hq. Liegt x im Nicht- 
Ablehnungsbereich, behält man die Nullhypothese bei. Benutzt man statt 
X die Prüfgröße T, so erhält man als kritische Grenzen Z a im Fall (i), / 2 a 
im Fall (ii) und —/ 2 a im Fall (iii). Ist Z r = (x — ^o)/^x die Realisierung 
von T, so ergibt sich die Testentscheidung durch: 



(i) 




— H 0 ; 


|/r| > Za 


— Hi 


(ü) 


tr ^ ^2a 


— H 0 ; 


tr ^ t^oc 


— Hi 


(üi) 


tr ^ —/2a 


— H 0 ; 


tr / 2a 


— Hi 



• Ist die Grundgesamtheit nicht notwendigerweise normalverteilt, aber 
die Grundgesamtheitsvarianz weiterhin bekannt, so ist X bzw. T = 
(X — fiQ )/<Tx für große n (n > 30) approximativ normalverteilt (Zen- 
traler Grenzwertsatz), und man kann das gleiche Testverfahren wie oben 
verwenden (approximativer Gauß-Test). 

• Ist die Grundgesamtheitsvarianz unbekannt, so läßt sie sich durch die 
Stichprobenvarianz schätzen. Im Falle großer Stichproben (n > 30) 
läßt sich auch dann mit Hilfe der Normalverteilung das obige Testver- 
fahren durchführen. Auch hier handelt es sich um einen approximativen 
Test. Die exakte, für kleine n anzuwendende, Testverteilung für 

soll in Abschnitt 3.10 besprochen werden. 

Das tatsächliche Signifikanzniveau a r , bei dem die Nullhypothese gerade noch 
akzeptiert wird, ergibt sich aus t ar = |Z r | zu a r = 1 -3>(|* r |) im Falle (i) und 
aus t2a r = |*r| zu a r = (1 — $(|/ r |))/2 im Falle (ii) bei t r > 0 bzw. (iii) bei 
t r < 0 . 
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3.8.2 Homograde Fragestellung 

Wir setzen voraus, daß eine große Stichprobe vorliegt (d.h. n7To(l — tt 0 ) > 9). 
Außerdem gehen wir von einer durch Z.m.Z. (oder durch Z.o.Z. bei kleinem 
Auswahlsatz ( n/N < 0.05)) gewonnenen Stichprobe aus (sonst ist in den 
folgenden Prüfgrößen der Korrekturfaktor zu berücksichtigen). Nach 
dem Zentralen Grenzwertsatz gilt dann für die Prüfgröße 



T = 



P - 7Tq 

\/(7ro(l - 7To))/n 



AV(0,1). 



Man unterscheidet die Hypothesenpaare (7To fester numerischer Wert): 



(i) 


Ho : 


7T = 7T 0 


Hi : 




(ü) 


Ho : 
oder 


7T = 7T 0 
7T < 7TQ 


Hi : 


TT > 7To 


(iii) 


Ho : 


o 

II 


Hi : 


7T < 7T 0 



oder 7r > 7To 

Die Vorgabe von a erlaubt wiederum c|ie Bestimmung der kritischen t- Werte 
aus der NV( 0, 1)-Tabelle. Entsprechend wie oben bestimmt man die Grenzen 
des Verwerfungsbereichs: 



(i) Pk = 7T 0 ± t a} /^ 

(Ü) Pk — ™ 0 + ^ 2 a ~^~ n ^ ^ 

(iii) Pk = *o - t 2a \J 

Die Testentscheidung erhält man durch Vergleich der Realisation von P mit 
dem Verwerfungsbereichs oder durch Berechnung der Prüfgröße 



f _ P-kq 

x/Oo(l - ir 0 ))/n 

und Vergleich mit den entsprechenden kritischen t- Werten (Entscheidung ent- 
sprechend wie in 3.8.1). Für kleine Stichproben verweisen wir wieder auf 
Abschnitt 3.10. 



3.8.3 Beurteilung eines Tests 

Betrachten wir wieder einen Einstichprobentest für p (die folgenden Überle- 
gungen lassen sich ohne weiteres auf andere Parametertests übertragen, bei 
denen sich die Nullhypothese auf einen eindimensionalen Parameter bezieht 
wie z.B. tt). Sei ©o der Nullhypothesenbereich und ©i der Alternativhypo- 
thesenbereich. Die Test verfahren waren so konstruiert, daß 

a = sup W(X im Verwerfungsbereich) 
i?e © 0 

= ^(Eintreten des Fehlers l.Art) 
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vorgegeben war. Von einem „guten“ Test würden wir dann verlangen, daß 
die Wahrscheinlichkeit ß = ^(Eintreten des Fehlers 2. Art) bei festem a so 
klein wie möglich ist. Aus Abschnitt 3.7 wissen wir bereits, daß wir nicht 
gleichzeitig a und ß beliebig klein machen können und daß der numerische 
Wert von ß vom tatsächlichen Wert E ©i von /i und von n abhängt (vgl. 
Abbildung 3.1). ß ist also bei gegebenem a und festem Stichprobenumfang 
n eine Funktion von E ©i: ß(pi) heißt Operationscharakteristik , ihren 
Graph bezeichnet man als OC- Kurve. 

Der Wert von 1 — ß gibt dann die Wahrscheinlichkeit dafür an, daß der 
Fehler 2. Art nicht eintritt. Bei gebenem a und bei festem Stichprobenumfang 
n ist 1 — ß ebenfalls eine Funktion von p\ E ©i: 1 — ß(fii) heißt Gütefunktion 
oder Mächtigkeit des Tests . 1 — ß{pi\) gibt also die Wahrscheinlichkeit an, 
daß beim vorliegenden Test verfahren Ho verworfen wird, wenn der wahre 
Parameterwert zum Alternativbereich ©i gehört. 

Sind bei einem Test zum Signifikanzniveau a diese Wahrscheinlichkeiten 
für alle möglichen Werte nicht kleiner und für mindestens einen Wert 
größer als bei einem zweiten Test zum selben Signifikanzniveau, so nennt man 
den ersten gleichmäßig besser ( oder trenn schärf er). Graphisch erkennt man 
dies daran, daß der Graph der Gütefunktion des ersten Tests nicht unterhalb 
des Graphen der Gütefunktion des zweiten Tests verläuft. Für die entspre- 
chenden OC-Kurven heißt dies: die OC-Kurve des ersten Tests verläuft nicht 
oberhalb der OC-Kurve des zweiten. In diesem Falle würde man den ersten 
Test dem zweiten vorziehen (Dominanzkriterium für Testverfahren). 

Die Überlegungen im vorausgegangenen Abschnitt zeigen, daß zur Ver- 
besserung der Güte eines Tests insbesondere die Erhöhung des Stichproben- 
umfangs in Frage kommt. Ökonomische Gründe können allerdings gegen eine 
solche Maßnahme sprechen. 



Aufgabe 3.8/1 Kommentieren Sie folgende Aussagen: 

a) Von zwei konkurrierenden Hypothesen ist diejenige als Nullhypothese zu 
nehmen, deren fälschliche Verwerfung die unangenehmeren Konsequenzen 
bewirkt. 

b) Zwischen dem Nicht-Ablehnungsbereich bei einem zweiseitigen Test und 
der Intervallschätzung beim Mittelwert besteht bei gleichem a ein enger 
Zusammenhang. 



Aufgabe 3.8/2 Der Hersteller eines bestimmten PKW-Typs behauptet, der 
durchschnittliche Benzinverbrauch pro 100 km betrage höchstens 8.0 1 bei 
einer Standardabweichung von 0.6 1. Zur Überprüfung dieser Behauptung 
führt die Stiftung Warentest einen Test mit 36 PKW dieses Typs durch. 



a) Formulieren Sie die Hypothesen dieses Tests. 
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b) Welche Werte für den durchschnittlichen Benzinverbrauch der Testwagen 
führen zu einer Ablehnung der Herstellerbehauptung, wenn das Signifi- 
kanzniveau dieses Tests 0.05 betragen soll? 

c) Wie groß ist die Wahrscheinlichkeit, daß beim vorliegenden Test verfah- 
ren die Herstellerbehauptung beibehalten wird, obwohl der wahre durch- 
schnittliche Benzinverbrauch dieses PKW-Typs bei 8.0645 1 pro 100 km 
liegt? 

d) Worauf wäre bei der Beantwortung der letzten beiden Fragen zu achten, 
wenn die Stiftung Warentest lediglich 9 PKW testen würde? Welche für 
die Rechnung(en) relevante Größe(n) würde(n) sich ändern? 



Aufgabe 3.8/3 Eine Untersuchung in einem Arbeitsamtsbezirk ergab, daß 
522 der gemeldeten 900 Erwerbslosen keine qualifizierte Ausbildung besaßen. 

a) Bestätigt diese Stichprobe die Aussage von Arbeitsmarktexperten, die 
von einem Anteil von 60% Personen ohne qualifizierte Ausbildung an den 
Erwerbslosen insgesamt ausgehen? (a = 0.05) 

b) Wie groß ist die Wahrscheinlichkeit für den Fehler 2.Art in diesem Falle, 
wenn der wahre Anteilswert in der Grundgesamtheit 0.5 beträgt? 

c) Wodurch läßt sich die Güte eines Tests beurteilen? 



Aufgabe 3.8/4 Laut amtlicher Statistik betrug die durchschnittliche Ver- 
weildauer der Patienten in Allgemeinen Krankenhäusern des Landes NRW 
im Jahre 1978 16 Tage. 

a) Bei einer neueren Untersuchung für 1980 wurden folgende Verweildauern 
festgestellt: 



Verweildauer [Tage] 


0-6 


7-14 


15-26 


27-74 


Anzahl der Patienten 


10 


45 


41 


4 



Unterstützt dieses Stichprobenergebnis die Hypothese, daß sich die durch- 
schnittliche Verweildauer seit 1978 nicht signifikant verändert hat? (1 — 
a = 0.9545) 

b) Verändert sich das Ergebnis in a), wenn Sie als Nullhypothese Ho : /i > 16 
formulieren? 

c) Für welches Signifikanzniveau wird in a) die Nullhypothese verworfen? 

d) Erläutern Sie die folgende Aussage: „Ein Test ist trennschärfer als ein 
anderer“ . 
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Aufgabe 3.8/5 Die Allgemeine Bevölkerungsumfrage der Sozialstatistik 
(ALLBUS 1988) umfaßt 3052 Interviews mit ausgewählten deutschen Per- 
sonen, die in der BRD oder West-Berlin in Privathaushalten wohnen und die 
bis zum Befragungstag das 18. Lebensjahr vollendet haben (Zentralarchiv 
für empirische Sozialforschung 1988, Methodenbericht). Dabei empfanden 
die Umweltbelastung durch Indust rieabfalle in den Gewässern als sehr stark 
1625 Personen, als ziemlich stark 983 Personen, als sehr schwach 270 Perso- 
nen, als nicht vorhanden 127 Personen. 45 antworteten „ich weiß nicht“ und 
3 gaben keine Antwort. Prüfen Sie unter der Annahme, daß eine einfache 
Stichprobe vorliegt, die Hypothese, daß mindestens 88% der Grundgesamt- 
heit die Belastung als zumindest stark empfinden (a=0.05). 



Ergänzungen und Bemerkungen 

• Einige Bemerkungen zu der hier und in anderen Büchern gewählten Be- 
zeichnungsweise: Anstatt der Begriffe „kritischer Bereich“ oder „Verwer- 
fungsbereich“ wird auch der Begriff „Ablehnungsbereich“ benutzt. Hin- 
zuzufügen wäre, daß sich alle drei Begriffe auf die Nullhypothese H o be- 
ziehen, daß also immer „Verwerfungsbereich von Ho“ usw. gemeint ist. 
Für „Nicht-Ablehnungsbereich“ wird von einer Reihe von Autoren auch 
der Begriff „Annahmebereich von Ho“ benutzt. Wir haben diesen Begriff 
vermieden, weil er zu Fehlinterpretationen der Testentscheidung „Ho wird 
nicht verworfen“ Anlaß geben kann. 

• Die zum Testverfahren herangezogene Verteilung heißt Testverteilung. In 
diesem Abschnitt wurde also lediglich die Normalverteilung als Testver- 
teilung benutzt. Weitere Test Verteilungen lernen Sie in den Abschnitten 
3.9, 3.10 und 3.11 kennen. 

• Die von uns zur Beurteilung eines Signifikanztests betrachtete Gütefunk- 
tion vergleicht Tests zum Niveau a aufgrund der Höhe der Wahrschein- 
lichkeit ß für verschiedene ^i-Werte. Auch weitere in den Lehrbüchern 
erwähnte Gütekriterien beziehen sich oft nur auf die Größen a und ß. 
In diesem Zusammenhang stellen sich eine Reihe von Fragen, die jedoch 
nur in dem allgemeinen Rahmen einer Testtheorie und in einem entschei- 
dungstheoretischen Kontext angegangen werden können, wie z.B. : 

- Gibt es in einer durch unterschiedliche Testgrößen oder /und unter- 
schiedliche Konstruktionsverfahren für die Verwerfungsbereiche von 
Ho gekennzeichneten Klasse von Testverfahren ein bezüglich bestimm- 
ter (welcher?) Gütekriterien optimales Verfahren (vgl. die Literatur 
zum sogenannten Fundamental-Lemma von Neyman und Pearson z.B. 
in Ferguson (1967) oder Fisz (1976), Kapitel 16)? 

- Lassen sich Gütekriterien formulieren, die nicht nur die Wahrschein- 
lichkeiten a und ß für Fehlentscheidungen, sondern insbesondere de- 
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ren mögliche Konsequenzen in die Testbeurteilung einbeziehen (vgl. 
Ferguson (1967))? 



3.9 Signifikanztests für die Varianz 



Wir gehen von einer normal verteilten Grundgesamtheit X ~ NV(ß,cr) mit 
unbekannten Parametern ß und er aus und interessieren uns für Hypothesen- 
paare folgender Art: 



(i) 


H 0 : 


= 


Hi : 


<r 2 ^ cr'i 


(ü) 


Ho : 
oder 


<r 2 < crl 


Hi : 


<7 2 > <t \ 


(iii) 


Ho : 
oder 


<r 2 = 

> <?o 


Hi : 


<t 2 < cr'i 



Dabei ist ein fester numerischer Wert. 

Die Stichprobenfunktion (n — l)S 2 _ l /cr 2 dient als geeignete Testprüfgrö- 
ße. Nach 3.6 gilt (n — l)^^.!/^ ~ X 2 ^^ — 1), wenn die Stichprobenvariablen 
unabhängige Zufallsvariablen sind. 

Aus den tabellierten x 2 -Werten (Verteilungsfunktion) läßt sich dann 
nach Vorgabe eines Signifikanz niveaus a der Verwerfungsbereich von Ho für 
die Prüfgröße \r — ( n ~ 1 ) s n-i/ a o bestimmen: 

(0 [°>Xa/2,n-l) U (X?_a/2,n-l. 00 ) 



(Ü) (Xl-a,»-l»«>) 

(iü) [0,xl, n -i)- 



Zur Testentscheidung ist also aus einer vorliegenden einfachen Stichprobe die 
Größe 



Xr = 



ns * 



a o a o t=1 



zu berechnen und, wenn dieser Wert im Verwerfungsbereich hegt, Ho zu 
verwerfen, andernfalls, wenn dieser Wert im Nicht- Ablehnungsbereich von 
Ho liegt, Ho beizubehalten. 

Ist ß bekannt, kann die x 2 V(n)- verteilte Prüfgröße - ß) 2 /a 2 

zur Testentscheidung verwendet werden. 



Aufgabe 3.9/1 Bestimmen Sie den Nicht- Ablehnungsbereich für den Hy- 
pothesentest 

H 0 :<t 2 = 10 Hx'.g 2 ^ 10 

bei ol — 0.002 und einem Stichprobenumfang von 11, wenn ß unbekannt ist. 
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Aufgabe 3.9/2 Eine einfache Stichprobe vom Umfang n=10 aus einer nor- 
malverteilten Grundgesamtheit mit Erwartungswert fi — 0 liefere folgendes 
Ergebnis: 



-2 0 1 0 0 3 1 -2 0 -1. 

Testen Sie, ob dies signifikant (a = 0.02) der Hypothese widerspricht, die 
Grundgesamtheitsvarianz sei 1. 



Aufgabe 3.9/3 Langjährige Erfahrungen an einer Hochschule stützen die 
Annahme, daß die Zeit, die zur Bearbeitung der Statistik-Klausur erforderlich 
ist, eine normalverteilte Zufallsvariable mit Mittelwert 110 Min. und einer 
Standardabweichung von höchstens 10 Min. ist. 

a) Prüfen Sie mit Hilfe eines geeigneten Hypothesentests zum Signifikanzni- 
veau 0.05, ob die bei der letzten Statistik-Klausur (101 Teilnehmer) ermit- 
telte Varianz von 121 signifikant höher als die Erfahrungswerte ausfällt. 

b) Ermitteln Sie die Wahrscheinlichkeit für den Fehler 2.Art bei o.a. Test, 
wenn der wahre Wert der Standardabweichung 10.24 Min. beträgt. 



Ergänzungen und Bemerkungen 

• Der in diesem Abschnitt beschriebene Signifikanztest ist nur für normal- 
verteilte Grundgesamtheiten anwendbar. Er ist nicht sehr robust ge- 
genüber Verletzungen der Normalverteilungsannahme. 



3.10 Inferenz bei Vor liegen einer kleinen 
Stichprobe 

Die Bedeutung der Normalverteilung für die Schätz- und Testtheorie be- 
ruht im wesentlichen auf dem Zentralen Grenzwertsatz und damit auf der 
Voraussetzung großer Stichprobenumfänge. In der Praxis, insbesondere im 
wirtschafts- und sozialwissenschaftlichen Bereich, sind jedoch kleine Stich- 
probenumfänge eher die Hegel als die Ausnahme. Um Inferenz aussagen aus 
kleinen Stichproben ableiten zu können, sind Verteilungsannahmen über die 
Grundgesamtheit erforderlich. 

3.10.1 Konfidenzintervalle und Signifikanztests für fi 

Ist die Grundgesamtheit normal verteilt, so ist (X — v)/<Tx auch für kleine 
Stichproben standardnormalverteilt, und die in den Abschnitten 3.5 und 3.8 
entwickelten Methoden können auch in diesem Falle angewandt werden. Da- 
bei wird vorausgesetzt, daß a 2 bekannt ist. 
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Gehen wir wieder von einer (annähernd) normalverteilten Grundgesamt- 
heit aus. <r 2 sei jetzt unbekannt. Sowohl für die Konstruktion eines Konfi- 
denzintervalls für // als auch zur Festlegung eines Testverfahrens für eine 
Nullhypothese über /i ist die Kenntnis der exakten Verteilung der Testgröße 
T = ^ mit 



s x — 




Z.m.Z oder Z.o.Z. und kleiner Auswahlsatz 
Z.o.Z. (großer Auswahlsatz) 



erforderlich. 

Es kann gezeigt werden, daß im Falle normalverteilter Grundgesamtheit 
die Stichprobenfunktionen X und S 2 _ x unabhängig sind. Nach Abschnitt 
2.12 ist demnach 

T=(X-p)/Sx~SV(n- 1). 

Die kritischen Werte der Student- Verteilung mit v Freiheitsgraden liegen in 
tabellierter Form für verschiedene Freiheitsgrade v im Anhang (Tabelle 4) 
vor. 

Zu Konfidenzintervallen bzw. Parametertests für /i gelangt man in die- 
sem Falle durch Ersetzen von a x durch a x , die Realisation von S x {s n -i/y/n 
bei Z.m.Z.), in den entsprechenden Formeln sowie durch die Entnahme der zu 
a gehörenden t- Werte aus der Tabelle der entsprechenden Student- Verteilung 
statt aus der der Standardnormalverteilung. 

Bereits im Abschnitt 2.12 haben wir darauf hingewiesen, daß für große 
n die Student-Verteilungswerte durch die entsprechenden Werte der Stan- 
dardnormal Verteilung approximiert werden können; für kleine Stichproben- 
umfänge sind die Werte aus der Student-Verteilung allerdings größer als die 
entsprechenden Normal verteilungs werte und reflektieren die zusätzliche Unsi- 
cherheit der Schätzung bzw. Testentscheidung aufgrund der vorangegangenen 
Schätzung von a. 



3.10.2 Signifikanztests für ir 

Liegt eine dichotome Grundgesamtheit vor, so läßt sich für Parametertests für 
den Anteilswert 7 r bei kleinen Stichproben (wenn die Voraussetzung 7i7r(l — 
7r) > 9 für eine Anwendung des Zentralen Grenzwertsatzes nicht erfüllt ist) 
die Binomialverteilung als Testverteilung an wenden ( Binomialtest ). Machen 
wir uns dies an folgendem Beispiel klar: 

Bei der Wareneingangskontrolle werden einer gelieferten Sendung 10 
Stücke entnommen und auf ihre Brauchbarkeit geprüft. Der Liefervertrag 
erlaubt eine Rücksendung auf Kosten des Lieferanten, wenn der Ausschußan- 
teil der Sendung größer als 10% ist. Die Stichprobe ergibt 3 fehlerhafte 
Stücke. Widerlegt dieses Ergebnis die Annahme, daß der Ausschußanteil der 
Gesamtsendung nicht größer als 10% ist (a = 0.05) ? Die Hypothesen lauten 
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also 



Hq : 7r < 0.1 H\ : Tr > 0.1. 



Eine Anwendung der Normalverteilung als Testverteilung ist ausgeschlossen 
aufgrund des kleinen Stichprobenumfangs. Unter den getroffenen Voraus- 
setzungen und der Annahme der Gültigkeit der Nullhypothese ergibt sich 
jedoch als Wahrscheinlichkeit für das Eintreten der beobachteten Stichprobe 
oder einer Stichprobe mit mehr Ausschußstücken bei tt = 0.1 (Grenze des 
Nullhypothesenbereichs) : 



W(X > 3) 



io 



10 



£ (^Jo.ro.g 10 -* 

2 /i n \ 

i - V f lo.i^o.g 10 -* 

x=0 x 7 

1 - (0.35 + 0.38 + 0.19) = 0.07. 



Nun ist 0.07 > a = 0.05, also ist H o beizubehalten. 

Da die Binomialverteilung eine diskrete Verteilung darstellt, läßt sich 
nicht in jedem Fall (wie bei der Normalverteilung) zu jedem a ein Test mit 
exaktem Signifikanzniveau a finden. Man wählt dann die kritische (ganzzah- 
lige) Grenze c für die Prüfgröße X so, daß W(Fehler l.Art) < a eingehalten 
wird. 

In empirischen Untersuchungen ist die Berechnung der Wahrscheinlich- 
keit entsprechend dem o. a. Beispiel und der anschließende Vergleich mit 
einem Wert a aufschlußreicher. 



3.10.3 Konfidenzintervalle und Signifikanztests für er 2 

Ist die Grundgesamtheit normal verteilt, so läßt sich die in Abschnitt 2.12 
eingeführte \ 2 Verteilung auch im Falle kleiner Stichproben für Schätz- und 
Test verfahren, die die Grundgesamtheitsvarianz er 2 betreffen, heranziehen 
(vgl. Abschnitte 3.6 und 3.9). 

Aufgabe 3.10/1 

a) Welcher Zusammenhang besteht zwischen der Wahrscheinlichkeit für den 
Fehler l.Art und dem Signifikanzniveau des Tests? 

b) Wie ist die Prüfgröße beim Binomialtest definiert und welchen Wertebe- 
reich besitzt sie? 

c) Welche Prüfgröße ist ^-verteilt? 



Aufgabe 3.10/2 Eine Umfrage bei 5 PC-Händlern einer Stadt ergab für die 
gleiche Konfiguration die folgenden Preise: 
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2410 DM, 2520 DM, 2190 DM, 2850 DM, 2530 DM 



a) Geben Sie sowohl für den Durchschnittspreis als auch die Varianz der 
Preise jeweils eine erwartungstreue Schätzung auf der Grundlage dieser 
Stichprobe. 

b) Unter der Voraussetzung normal verteilter Preise soll sowohl für den 
Durchschnittspreis als auch für die Varianz der Preise eine Intervallschät- 
zung (a=0.05) erstellt werden. 



Aufgabe 3.10/3 Bei der letzten Diplomprüfung im Wahlfach Statistik, an 
der nur 10 Personen teilnahmen, erreichten 3 Personen die Beurteilung „sehr 
gut“. Kann von einer signifikanten Verbesserung der Prüfungsleistungen ge- 
sprochen werden, wenn im langjährigen Durchschnitt der Anteil der mit „sehr 
gut“ bestandenen Prüfungen bei 20% lag (a=0.1)? 



Ergänzungen und Bemerkungen 

• Die dargestellten Verfahren setzen die Annahme eines bestimmten, durch 
endlich viele Parameterwerte charakterisierten Verteilungstyps für die 
Grundgesamtheitsverteilung voraus (z.B. Normalverteilung oder Binomi- 
alverteilung). Die Hypothesen beziehen sich dann auf einen (oder meh- 
rere) der unbekannten Parameter dieser die unbekannte Häufigkeitsver- 
teilung der Grundgesamtheit repräsentierenden theoretischen Verteilung. 
Solche statistischen Verfahren nennt man parametrisch . 

• Manchmal reichen die Informationen über die Grundgesamtheit jedoch 
nicht aus, einen bestimmten, durch endlich viele Parameterwerte gekenn- 
zeichneten Verteilungstyp festzulegen. Eine falsche Festlegung könnte die 
Quelle von Fehlentscheidungen sein. Um sich von dieser Voraussetzung 
frei zu machen, wurden eine Reihe von nicht-parametrischen Verfahren 
entwickelt: Die dem Test zugrundeliegenden Hypothesen setzen eine spe- 
zielle Form der Grundgesamtheitsverteilung (festgelegt durch endlich viele 
Parameter ) nicht voraus. Aber auch Hypothesen, die sich auf Maßzahlen 
wie Median oder Modus beziehen, nennt man nicht-parametrisch. So läßt 
sich mit Hilfe der Binomialverteilung ein einfacher nicht-parametrischer 
Test für den Median einer Verteilung konstruieren (vgl. Büning/Trenkler 
(1978), Abschnitt 4.4). Nichtparametrische Verfahren haben außerdem 
den Vorzug, in der Regel ein schwächeres Skalenniveau voraussetzen zu 
müssen als parametrische Verfahren. Beide Eigenschaften machen nicht- 
parametrische Verfahren interessant für die Anwendung in den Sozial- und 
Wirtschaftswissenschaften (vgl. Renn (1975)). 
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3.11 Anpassungstests 

Ein dem Statistiker häufig gestelltes Problem besteht darin, zu entscheiden, 
ob für die unbekannte Grundgesamtheitsverteilung eine explizit vorgegebene 
theoretische Verteilung (durch die Vorgabe aller die Verteilung festlegenden 
Parameter) unterstellt werden darf. So setzen viele Testverfahren (insbeson- 
dere bei kleinen Stichprobenumfängen; vgl. Abschnitt 3.10) eine bestimmte 
Form der Verteilung in der Grundgesamtheit voraus (z.B. die Normalvertei- 
lung), so daß sich vor deren Anwendung eine Prüfung dieser Verteilungsan- 
nahme an getrenntem Datenmaterial empfiehlt (nicht-parametrisches Verfah- 
ren). 

Der x 2 "Anpassungstest für Verteilungshypothesen basiert auf folgen- 
der Überlegung: Man zerlegt die Menge aller möglichen (eindimensionalen) 
Merkmalsausprägungen in disjunkte Teilmengen so, daß jede Merkmalsaus- 
prägung in genau einer Teilmenge erfaßt wird. Dann stellt man fest, wieviele 
der n Stichprobenwerte einer einfachen Stichprobe in den jeweiligen Teil- 
mengen einerseits tatsächlich liegen (beobachtet werden), andererseits bei 
Annahme der Nullhypothese Hq : F(x) = Fo(x) in diesen zu erwarten sind 
(errechnet werden). Mit Hilfe einer Prüfgröße, die die Abweichungen der er- 
rechneten von den beobachteten Werten mißt, und deren Verteilung läßt sich 
dann ein Verwerfungsbereich für Ho konstruieren und eine Testentscheidung 
herbeiführen. 

Bei eindimensionalen Zufalls variablen geht man dabei wie folgt vor: 

• Formulierung der Nullhypothese Ho : F(x) = Fq(x ) und Vorgabe des 
Signifikanz nive aus a. Dabei ist Fo(x) eine genau spezifizierte Verteilung 
wie z.B. VV(100,40). 

• Zerlegung der Achse, auf der die eindimensionalen Merkmalswerte abge- 
tragen werden, in k > 2 Intervalle Ij,j = 1 so, daß die Anzahl 

ej = npj ( pj = W(X G Ij) ) der in Ij bei Gültigkeit von Ho zu erwarten- 
den Stichprobenwerte für alle j = 1, . . ., k mindestens 5 beträgt. Die pj 
gewinnt man aus Fo(x). 

• Bestimmung der Anzahl bj der in Ij beobachteten Stichprobenwerte. 

• Berechnung der Abweichung 

2 _ Y'' (fy - e i ) 2 . 

Xr ~ 2^ e - 
3 = 1 3 

die entsprechende Testprüfgröße ist unter den getroffenen Voraussetzun- 
gen (einfache Stichprobe) approximativ x 2 V(fc — l)-verteilt. 

• Bestimmung des Verwerfungsbereichs von Ho aufgrund des festgelegten 
Signifikanzniveaus a und der x 2 ^(& — 1)- Verteilung. 
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• Testentscheidung durch Berechnung der Prüfgröße aufgrund einer einfa- 
chen Stichprobe und Prüfung, ob diese im Verwerfungsbereich liegt oder 
nicht: 



Xr > xl,k- 1 =* Ho verwerfen 

xl < Xl, k -i => Ho beibehalten. 

Mit diesem Testschema lassen sich Hypothesen der folgenden Art über- 
prüfen: 

• Die Grundgesamtheit ist normalverteilt mit fi = 0 und er = 1. 

• Die Unfallhäufigkeit an verschiedenen Wochentagen ist gleich verteilt. 

• Eine Lotterie ist fair, d.h. jedes mögliche Lotterieergebnis ist gleich wahr- 
scheinlich. 



Aufgabe 3.11/1 

a) Welches sind die Voraussetzungen für die Anwendung eines x 2 -Anpas- 
sungstests? 

b) Ist der x 2 -Anpassungstest ein zweiseitiger, rechtsseitiger oder linksseitiger 
Test? 

c) Ist der x 2 -Anpassungstest auch für kleine Stichproben geeignet? 



Aufgabe 3.11/2 Von 100 gekauften Losen bei einer Lotterie sind 40 Ge- 
winne. Bestätigt dies die Behauptung der Lotteriewerbung, daß jedes zweite 
Los gewinnt? (a = 0.05) 



Aufgabe 3.11/3 In einer Stadt wurden an den verschiedenen Wochentagen 
folgende Unfallzahlen registriert: 



Mo 


Di 


Mi 


Do 


Fr 


Sa 


So 


30 


10 


20 


10 


30 


20 


20 



Kann davon ausgegangen werden, daß die Unfallgefahr an allen Wochentagen 
gleich hoch ist? ( a = 0.05) 



Aufgabe 3.11/4 Ein den Süßigkeiten nicht abgeneigter Statistiker „prüft“ 
100 Cremehütchen. Er stellt fest, daß 24 Hütchen eine weiße, 27 eine gelbe, 
26 eine rote und 23 eine grüne Füllmasse aufweisen. Überprüfen Sie die 
Behauptung des Herstellers, alle Farben der Füllmassen würden gleich häufig 
verwendet. 
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Aufgabe 3.11/5 Ein Statistiker überprüft einen selbstgebastelten Würfel 
auf „Fairness“ (jede Augenzahl soll die gleiche Chance haben). Dazu würfelt 
er 60 mal und notiert die Anzahlen rij der Würfe, in denen die Augenzahl i 
fiel (i = 1, . . . , 6): 



i 


1 


2 


3 


4 


5 


6 


rii 


8 


11 


6 


12 


7 


16 



a) Wird der Statistiker auf Grund dieser Daten den Würfel bei einem Signi- 
fikanzniveau von 5% als nicht fair bezeichnen? 

b) Wie viele Würfe sind mindestens notwendig, damit die Voraussetzungen 
für die Gültigkeit des Tests in a) erfüllt sind? 

c) Wie kann bei dem Test in a) ein Fehler 2.Art entstehen? 



Ergänzungen und Bemerkungen 

• Ein Anpassungstest für stetige Verteilungen, bei dem als Prüfgröße die 
maximale Differenz der Werte von hypothetischer (gemäß Hq) und empi- 
rischer (gemäß der beobachteten Stichprobenverteilung) Verteilungsfunk- 
tion bestimmt wird, ist von Kolmogoroff/Smirnoff eingeführt und nach 
ihnen benannt worden. Im Gegensatz zum x 2 - Anpassungstest ist die- 
ser Kolmogoroff-Smirnoff- Anpassungstest für kleine Stichprobenumfänge- 
auch geeignet. Er benötigt jedoch zur Berechnung der Prüfgröße eine voll 
spezifizierte Verteilungsannahme in der Nullhypothese. Zu Einzelheiten 
hierzu vgl. z.B. Büning/Trenkler (1978), Kapitel 4. 

• Der x 2 - Anpassungstest wird in der Literatur auch vorgeschlagen, wenn 
die in der Nullhypothese vorgegebene Verteilung Fo nur dem Typ nach 
bestimmt ist und m Parameterwerte zur genauen Festlegung von Fo noch 
aus der vorliegenden Stichprobe mittels ML-Methode zu schätzen sind. 
Für die Prüfgröße x 2 wird dann die x 2 V(fc — m— 1)- Verteilung unterstellt. 
Albrecht (1980) macht darauf aufmerksam, daß dies nur approximativ für 
große k gilt, und gibt einen ausführlichen Überblick „On the correct use 
of the chi-square goodness-of-fit test“. 

• Der x 2 -Test geht auf Karl Pearsons Arbeiten in den Neunziger Jahren des 
vorigen Jahrhunderts zurück. 

• Eine weitere x 2 ^(& — l)-verteilte Prüfgröße für Anpassungstests ist die 
log-LQ-Teststatistik 2 bj \n(bj/ej). 




Kapitel 4 

Statistische Inferenz: 
Zweistichprobenfall und 
bivariate Datensätze 



In Kapitel 3 haben wir uns mit den Grundprinzipien statistischen Schließens 
und Anwendungen der induktiven Methoden im Einstichprobenfall vertraut 
gemacht. Dabei wurde jeweils ein statistisches Merkmal untersucht. In die- 
sem Kapitel wollen wir uns nun Fragestellungen zuwenden, die entweder 

• das Ziehen zweier oder mehrerer unabhängiger Stichproben zur verglei- 
chenden Untersuchung der Ausprägungen eines Merkmales in unterschied- 
lichen Grundgesamtheiten oder 

• das Ziehen zweier bzw. mehrerer verbundener Stichproben, d.h. die si- 
multane Erhebung von zwei bzw. mehreren eindimensionalen Merkmalen 
bzw. einem multidimensionalen Merkmal bei jeder statistischen Einheit 

erforderlich machen. Im ersten Fall spricht man vom Mehrstichprobenfall; 
der zweite Fall führt zu bivariaten bzw. multivariaten Datensätzen. Im er- 
sten Fall steht der Vergleich zwischen den statistischen Einheiten, die aus 
verschiedenen Grundgesamtheiten stammen, im Vordergrund. Im zweiten 
Fall richtet sich das Interesse auf den Zusammenhang bzw. auf Abhängigkei- 
ten zwischen Variablen. Typische Fragestellungen sind z.B. : 

• Erhalten Männer und Frauen in der Bundesrepublik Deutschland bei glei- 
cher Ausbildung, bei gleicher Berufserfahrung und bei gleichem Alter in 
einem bestimmten Wirtschaftssektor im Durchschnitt den gleichen Lohn? 

• Treten bestimmte Berufskrankheiten wie z.B. Hauterkrankungen, Sili- 
kose, Schleimhaut Veränderungen in bestimmten Berufsgruppen häufiger 
auf als in anderen? 




• Bestehen Zusammenhänge zwischen Lebensgewohnheiten, Eßgewohnhei- 
ten, Wohnort auf der einen Seite und der Häufigkeit bestimmter Krank- 
heitsbilder auf der anderen Seite? 

Bei der Behandlung dieser Fragestellungen ist für die Auswahl eines geeig- 
neten statistischen Modells wieder auf das Skalenniveau der Variablen zu 
achten. Wir beschränken uns hier auf nominal- bzw. kardinalskalierte Merk- 
male. 

Entsprechend gliedert sich dieses Kapitel wie folgt: 



Zahl der Stichproben 


Merkmal(e) 


Zahl der Merkmale 


kardinalskaliert 


nominalskaliert 


zwei unabh. Stichproben, 


4.1.1 (Schätzen) 


4.1.2 (Schätzen) 


ein Merkmal 


4.2.1 (Testen), 4.3 


4.2.2 (Testen) 


mehr als zwei 






unabhängige Stichproben, 


4.5 


4.4.1 


ein Merkmal 






eine (verbundene) Stichpr., 


4.6 


4.4.2 


zwei Merkmale 


4.7 





Die Stichproben werden - sofern nicht ausdrücklich etwas anderes de- 
finiert wird - als einfach vorausgesetzt. Die Unterscheidungen mehrerer 
Stichproben bzw. bivariater Datensätze in diesem Kapitel stellen auch einen 
Übergang von der univariaten statistischen Analyse zu multivariaten stati- 
stischen (mehr als zwei Variable, die gleichartig behandelt werden) bzw. zu 
multiplen ökonometrischen (mehr als zwei Variable, die aber in abhängige 
(zu erklärende) und unabhängige (erklärende) Variablen unterteilt werden) 
Methoden dar. Allerdings können hier nur Grundkonzepte für diese wei- 
terführenden Gebiete der Statistik vorgestellt werden. 



4.1 Schätzung von Mittel- bzw. Anteilswert- 
differenzen 

4.1.1 Heterograde Fragestellung 

Zum Vergleich zweier Grundgesamtheitsmittelwerte //j, ^2 eines kardinalska- 
lierten Merkmales X in zwei Grundgesamtheiten soll die Differenz [i\ — \i 2 
geschätzt werden. Dazu ziehen wir unabhängig voneinander aus beiden 
Grundgesamtheiten je eine einfache Stichprobe vom Umfang n\ bzw. n 2. 
Mit v\ bzw. bezeichnen wir die jeweiligen Grundgesamtheitsvarianzen. 

a) Für die Stichprobenmittelwertvariablen X, (i = 1,2) gilt dann: 
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und somit für die Differenz AX = X\ — X 2 : 

E(AX) = l i l -ß 2 , V(AX)=^- + ^-. 

n i ri 2 

AX ist also ein erwartungstreuer Punktschätzer für die Differenz ^ 1—^2 
mit der Eigenschaft 

lim V(AX) = 0, 

ni,ri2—>OQ 

d.h. AX ist eine konsistente Schätzfunktion für die Differenz der Grund- 
gesamt heit smittelwerte . 

b) Im Hinblick auf Intervallschätzungen sind verschiedene Fallunterscheidun- 
gen zu treffen, je nachdem ob 

• die Zufallsvariable X normal verteilt ist oder nicht; 

• die Grundgesamtheitsvarianzen bekannt oder unbekannt, bzw. als 
gleich oder verschieden vorausgesetzt werden können; 

• die Stichprobenumfänge groß oder klein sind. 



bl) Ist X normal verteilt in beiden Grundgesamtheiten und sind die 
Grundgesamtheitsvarianzen er 2 und <j\ bekannt, so gilt aufgrund des 
Reproduktionssatzes für alle Stichprobenumfänge n\ bzw. 712 : 



Analoge Überlegungen wie in Abschnitt 3.5 führen zum Konfidenzin- 
tervall 



- m/£+& + m/S+S 



bei vorgegebenem Konfidenzniveau 1 — a = $(t a ). Liegen zwei kon- 
krete, unabhängig voneinander gezogene einfache Stichproben vor, so 
erhält man durch Einsetzen der Realisation x\ — x 2 von AX und t a 
aus der <£(tf)-Tabelle der Standardnormalverteilung (nach Vorgabe von 
a) eine Intervallschätzung für /ii — 

Gilt <j\ — cr\ — <t 2 (Varianzhomogenität), so vereinfacht sich die For- 
mel für die Bestimmung der Grenzen des Konfidenzintervalls zu 



AX ± t a (j 



n 1 -f n 2 
nin 2 



b2) Ist X in beiden Grundgesamtheiten normalverteilt mit unbekannten 
Grundgesamtheitsvarianzen, gilt aber er 2 — <j\ = er 2 ( Varianz homoge- 
nität), so erhält man mit der „gepoolten“ Stichprobenvarianz 

C 2 _ (”1 “ ^ ) *^n i — l + ( n 2 - 1)52,.! _ + n 2 S| 

ni ’" 2 “ n 1 + n 2 - 2 m + n 2 -2 
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als Schätzfunktion für <r 2 das Konfidenzintervall 



A X-t S a V S nu n 



n l n 2 

n\ri2 



A X+t s Q v S nu „ 2 



n i + n 2 
nin 2 



wobei S n i,ri2 — +y s ?n,n 2 un< ^ ta V aus der Tabelle der Student- Ver- 
teilung mit v — 7i\ -J- Ti 2 — 2 Freiheitsgraden zu entnehmen ist. Für 
v > 30 ist die Approximation der Student-Verteilung durch die Stan- 
dardnormalverteilung möglich. 

b3) Ist X normalverteilt in beiden Grundgesamtheiten mit unbekannten 
Grundgesamtheitsvarianzen und liegt keine Varianzhomogenität vor, 
so ist das Konfidenzintervall 



A X-t 



sv , 



Ul 



+ 



Sl 



n 2 — 1 
n 2 



,A X + t* 



sv t 






n i 



n 2 



zu verwenden, wobei der tf^-Wert aus der Tabelle der Student-Ver- 
teilung mit 

(«n.-l/ui +4 2 -l/u2) 2 

" «-i/ni) 2 /("i - 1) + (* 2 a .x/n 2 ) 2 /(n 2 - 1) 

als Freiheitsgrad zu entnehmen ist. Auch hier ist die Approxima- 
tion der Student-Verteilung durch die Normalverteilung für v > 30 
möglich. 

b4) Ist X in mindestens einer Grundgesamtheit nicht normal verteilt, sind 
c t\ und er l jedoch weiterhin bekannt, so gilt aufgrund des Zentralen 
Grenzwertsatzes 



A X~NV (lii-n, VS + S)- 

Für genügend große Stichprobenumfänge (Faustregel: n\ > 30 und 
n 2 > 30) liefern die in bl) angegebenen Formeln dann approximative 
Konfidenzintervalle bzw. Intervallschätzungen für — fi 2 . 

b5) Im Falle einer beliebigen Verteilung von X in den Grundgesamtheiten, 
unbekannter Grundgesamtheitsvarianzen und zweier unabhängig von- 
einander gezogener Stichproben mit genügend großen Stichprobenum- 
fängen (ni >30 und n 2 > 30) lassen sich die Grundgesamtheitsvari- 
anzen durch die entsprechenden Stichprobenvarianzen schätzen. Man 
erhält ein approximativ gültiges Konfidenzintervall mit den Grenzen 



AX ± t a 



S 2 ni - 1 | 

ni n 2 
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bzw. 



A X±t a 



S'j [ 51 

rzi — 1 ri2 — 1 



Wird zusätzlich Varianzhomogenität in der Grundgesamtheit unter- 
stellt, so wird die gepoolte Stichprobenvarianz 3 aus b2) als 
Schätzer sowohl für a\ als auch für eingesetzt. 



4.1.2 Homograde Fragestellung 

Zum Vergleich zweier Grundgesamtheitsanteilswerte 7Ti, 7r2 eines dichotomen 
Merkmales X in zwei Grundgesamtheiten soll die Differenz 7Ti — 7T2 geschätzt 
werden. Dazu ziehen wir unabhängig voneinander je eine einfache Stichprobe 
vom Umfang ni bzw. ri 2 aus beiden Grundgesamtheiten. 

a) Seien Xu , . . . , Xj n . die Stichprobenvariablen der Stichproben i = 1, 2 und 
Xi = Y^Li Xij • Dann gilt für Pi - Xi/nf. 

E(Pi) = TTi, V(P X ) - n t -7Ti(l - TTf). 

Für die Differenz AP — P x — P 2 erhält man: 

E(AP) = JT! - 7T 2l 1/(AP) = 

n i n 2 

AP ist also erwartungstreue und konsistente Schätzfunktion für die Dif- 
ferenz 7Ti — 7T2- 

b) Ist 7li7Ti(l — 7Ti) > 9 Und n27T 2 (l — 7T2) > 9, SO gilt 

AP JVK (^ - 7T 2j + M^>) 

und man erhält das (approximative) Konfidenzintervall für die Differenz 
der Anteilswerte mit den Grenzen 

AP ± t a \/ M 1 -* 1 ) + 

Da 7Ti und 7r2 unbekannt sind, muß man diese in der Formel für die 
Standardabweichung der Differenz der Anteilswerte durch die entspre- 
chenden Anteilswerte der jeweiligen Stichprobe schätzen (man verwendet 
diese auch zur Überprüfung der Voraussetzung der Approximation, also 
ob nipi(l — pi) > 9 und 712 ^ 2(1 — P 2 ) > 9) und erhält so als Grenzen des 
Schätzintervalls 

n-«±i.\/ s Sr7iSEäi 

mit t a aus der $(t)-Tabelle der Standardnormalverteilung. 
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Aufgabe 4.1/1 Sei 1 — a ein gegebenes Konfidenzniveau für eine Mittel- 
wertsdifferenzenschätzung. Bestimmen Sie den Wahrheitswert der folgenden 
Aussagen: 

a) Je größer die Stichprobenumfänge, desto größer wird das Konfidenzinter- 
vall für gegebenes 1 — a. 

b) Je größer die Varianzen der Stichproben sind, desto größer wird das 
Schätzintervall (falls die Grundgesamtheitsvarianzen unbekannt sind). 

c) Je größer das gegebene Konfidenzniveau 1 — a, desto größer wird das 
Schätzintervall. 



Aufgabe 4.1/2 In einer 100 Personen umfassenden Stichprobe beträgt die 
mittlere Körpergröße 173 cm. Die mittlere Körpergröße der erfaßten 30 
männlichen Personen beläuft sich auf 180 cm. 

a) Geben Sie eine Intervallschätzung (Aussagesicherheit 0.95) für die Dif- 
ferenz der mittleren Körpergröße männlicher bzw. weiblicher Personen, 
wenn die Standardabweichung der Körpergröße bei männlichen Personen 
y/9Ö cm und bei weiblichen Personen \/7Ö cm beträgt. 

b) Beantworten Sie Teil a) für den Fall, daß die Varianzen der Grundge- 
samtheit unbekannt sind und lediglich die Varianz der Körpergröße für 
alle Personen in der Stichprobe mit 95.4 und die für männliche Personen 
in der Stichprobe mit 87 bekannt sind. 



Aufgabe 4.1/3 Eine Automobilzeitschrift läßt in einem Reifenvergleichs- 
test zwei Neuentwicklungen auf ihre Lebensdauer testen: Für die 100 dem 
Test unterzogenen Reifen des Fabrikats A ergibt sich eine durchschnittli- 
che Lebensdauer von 60000 km bei \/9900 km Standardabweichung; die 100 
getesteten Reifen des Typs B laufen im Durchschnitt 58000 km bei einer 
Standardabweichung von \/6831 km. 

a) Bestimmen Sie ein 95%-Konfidenzintervall für die Differenz der Mittel- 
werte der Grundgesamtheiten. 

b) Welche Auswirkungen hat die Annahme unbekannter, aber homogener 
Grundgesamtheitsvarianzen auf das Schätzverfahren und die Größe des 
Konfidenzintervalls? 

c) Die Tester unterziehen die Reifen einem Hochgeschwindigkeits-Bela- 
stungstest. Von jeweils 50 zufällig ausgewählten Reifen platzen 20 von 
Fabrikat A, 15 von Fabrikat B. Schätzen Sie (auf 90%-Niveau) die Diffe- 
renz der Grundgesamtheits-Anteilswerte. 
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Aufgabe 4.1/4 Bei der letzten Statistikklausur bestanden von 100 teilneh- 
menden Wirtschaftsingenieur-Studenten 80 die Klausur; 280 der 400 teilneh- 
menden BWL-Studenten erreichten ebenfalls die zum Bestehen der Klausur 
notwendige Punktzahl. Was läßt sich (bei einer Irrtumswahrscheinlichkeit 
von 0.05) über die Differenz der Grundgesamtheitsparameter sagen? 



Aufgabe 4.1/5 Zwei unabhängig voneinander gezogene Stichproben mit 
Zurücklegen vom Umfang n\ = 101 und n 2 = 201 ergaben =1000, X 2 — 
900 sowie sf=200 und s%= 400. Welchen Wert für a müssen Sie wählen, 
damit das Schätz intervall für n 1 — ^2 die Länge 8 hat? 



Aufgabe 4.1/6 100 Wasserproben am Unterlauf des Rheins ergaben 1990 
einen durchschnittlichen Phosphatwert von 2 mg P2O5//. Eine entsprechende 
Untersuchung 1988 ergab 2.1 mg P 2 O 5 /I. 

a) Was läßt sich aufgrund der Stichprobe über den Betrag der Differenz der 
durchschnittlichen Phosphatwerte aussagen? {u\ = 0*2 = 2;a = 0.05) 

b) Verändert sich die Antwort zu a), wenn die Grundgesamtheitsvarianz un- 
bekannt ist und die Stichprobenvarianzen s„ i _ l = Sn 2 -i = 2 betragen? 

c) Läßt sich ein Konfidenzintervall für die Differenz der Mittelwerte auch 
dann noch konstruieren, wenn nur jeweils 16 Wasserproben entnommen 
wurden? 



Aufgabe 4.1/7 Eine Umfrage unter 100 Frauen im Alter von 15 Jahren 
und darüber in der BR Deutschland ergab, daß 45% der Frauen Mütter von 
noch in der Familie lebenden ledigen Kindern sind. Von den Frauen mit den 
ledigen Kindern in der Familie waren 40% erwerbstätig. Bei den Frauen ohne 
ledige Kinder in der Familie betrug diese Quote 35%. 

a) Geben Sie eine Punktschätzung für den Anteil der erwerbstätigen Frauen 
mit ledigen Kindern in der Familie an der Gesamtzahl der Frauen im Alter 
von mindestens 15 Jahren in der BR Deutschland. 

b) Geben Sie eine Intervallschätzung für die Differenz der Erwerbstätigen- 
quote von Frauen mit ledigen Kindern in der Familie bzw. Frauen ohne 
ledige Kinder in der Familie (a=0.05). 

Ergänzungen und Bemerkungen 

• Sind die Stichproben nicht unabhängig voneinander gezogen, liegen also 
zwei verbundene einfache Stichproben vor, so erhält man eine Inter- 
vallschätzung für die Differenz zweier Mittelwerte, indem man zu den 
Differenzen di = X{ — yi der n Beobachtungswerte (ar* , j/*) übergeht und 
dann die Methoden aus dem Einstichprobenfall anwendet. 
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• Oft ist bei Intervallschätzungen für Differenzen nur die Fragestellung re- 
levant, ob der unbekannte Mittelwert der ersten Grundgesamtheit größer, 
gleich oder kleiner als der der zweiten aufgrund zweier vorliegender Stich- 
proben angenommen werden muß. Eine Antwort auf diese Frage erhält 
man dadurch, daß man das konstruierte Schätzintervall lediglich darauf- 
hin untersucht, ob es ganz im positiven Bereich liegt (/ 1\ > H2), ob es die 
0 enthält (// 1 = H2) oder ob es ganz im negativen Bereich liegt (hi < H2)- 

• Liegt bei den betrachteten Stichproben Z.o.Z. vor, so ist der Korrektur- 
faktor (N — n)/(N — 1) bei der Varianzformel zu berücksichtigen. 

• Der Fall unbekannter und ungleicher Varianzen wird in der Literatur als 
Behrens- Fisher-Problem bezeichnet. Für eine ausführliche Diskussion 
dieses Problems vgl. Pfanzagl (1978), Abschnitt 9.8, und die dort ange- 
gebene Literatur. 



4.2 Differenzentests für Mittel- bzw. Anteils- 
werte 

4.2.1 Heterograde Fragestellung 

Zur Überprüfung einer Hypothese über die Differenz der Grundgesamtheits- 
mittelwerte ui — H2 eines kardinalskalierten Merkmales X in zwei Grundge- 
samtheiten ziehen wir unabhängig voneinander aus beiden Grundgesamthei- 
ten je eine einfache Stichprobe vom Umfang ni bzw. ri2- cr\ bzw. seien 
die jeweiligen Grundgesamtheitsvarianzen. Die Durchführung der Tests folgt 
dem bereits vom Einstichprobenfall her bekannten Schema: 

• Festlegung des Hypothesenpaares 

i) Ho : hi - H2 = (Hi ~ ^2)0, H x : Hi ~ H2 ± (ßi ~ ^2)0 

ii) H 0 : Hi ~ ß 2 < (Hi ~ ^2)0, H x \ H\~ H 2 > (hi ~ ^2)0 

üi) H 0 : Hi - H2 > (ßi ~ ^2)0, #i • ßi ~ ß2 < (ßi ~ ^2)0- 

• Festlegung des Signifikanzniveaus a. 

• Wahl einer geeigneten Prüfgröße D (Teststatistik, Testfunktion) und Be- 
stimmung ihrer Realisation. 

• Vergleich der realisierten Prüfgröße mit den Grenzen des kritischen Be- 
reiches (Verwerfungsbereiches) aus der Testverteilung der Testfunktion: 

i) (-OO, -dk,a) u (4, er, -foo) 
ü) (dk, 2a, +00) 

Üi) (- 00 , -4,2a)- 

• Testentscheidung (Beibehaltung oder Verwerfung von Ho)- 
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Aus den Überlegungen zu 4.1.1 ergeben sich die folgenden Fallunterscheidun- 
gen: 

a) A normalverteilt in beiden Grundgesamtheiten und bekannt (Zwei- 

stichproben-Gaußtest) : 



D = 



(Ai — X2) — (fi 1 — ^2)0 




NV( 0,1) 



b) X normalverteilt in beiden Grundgesamtheiten, Grundgesamtheitsvari- 
anzen unbekannt, Varianzhomogenität: 

D = ~ A - * ~ (l“ ~ f ‘- io ~ 5K( ni + n 2 - 2) 

(Für ni + ri 2 — 2 > 30 ist die Approximation der Student- Verteilung durch 
die Standardnormalverteilung möglich.) 

c) X normalverteilt in beiden Grundgesamtheiten, Grundgesamtheitsvari- 
anzen unbekannt, keine Varianzhomogenität: 

D = (X 1 - X 2 )-(^- ß2 )o ~ svii/) 

V n 1 «2 



Dabei ist v entsprechend der Formel in 4.1.1 b3) zu bestimmen. Für v > 
30 ist die Approximation durch die Standardnormal Verteilung möglich. 

d) X in mindestens einer Grundgesamtheit nicht normalverteilt, af, cr\ be- 
kannt (approximativer Zweistichproben-Gaußtest ): 



D = 



(Al - X 2 ) - (^1 - /i2)o 




NV( 0,1) 



(Faustregel: ni > 30 und n 2 > 30). 

e) A beliebig verteilt, cr^cr^ unbekannt: 



D = 



_ (Ai - A 2 ) - (ßi — fi 2)0 



NV( 0,1) 



ri2 



(Faustregel: ni > 30 und n 2 > 30). 

Gilt zusätzlich Varianzhomogenität in diesem Fall, so werden _i durch 
die gepoolte Stichprobenvarianz S% „ 2 ersetzt. 
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4.2.2 Homograde Fragestellung 

Zur Überprüfung einer Hypothese über die Differenz der Grundgesamtheits- 
anteilswerte tti — 7T2 eines dichotomen Merkmals in zwei Grundgesamtheiten 
ziehen wir unabhängig voneinander je eine einfache Stichprobe vom Umfang 
n\ bzw. ri 2 aus den beiden Grundgesamtheiten. Die Hypothesenpaare sind 
von der Form: 

i) H 0 : tti - tt 2 = (tti - 7r 2 )o, Hi : *4 - tt 2 # (tti - tt 2 )o 

ii) H 0 : 7Ti - 7t 2 < (tti - tt 2 )o, /fi : 7Ti - 7t 2 > (tti - 7T 2 )o 

iii) #o : *i - 7T2 > (^1 - ^ 2 ) 0 , H\ : 7Ti - 7r 2 < (tti - 7r 2 )o. 

Von den Stichproben setzen wir voraus, daß sie genügend große Umfänge 
aufweisen (t2i7Ti(1 — 71 * 1 ) > 9 bzw. nipi(l — pi) > 9 und 7227r 2 (l — ^ 2 ) > 9 
bzw. n 2 p2(l — P 2 ) > 9). Dann gilt 



(•Pi ~ P 2 ) — (tti - 7r 2 )o 
\Ai(! - 7Ti)/ni + tt 2 (1 - 7r 2 )/n 2 



7VV(0,1). 



Bei gleichen Anteilswerten, also insbesondere bei ( 71*1 — 7^)0 = 0, schätzt man 
den Anteilswert in der Varianzformel durch Verwendung des Schätzers 

niP 1 -fn 2 P 2 

P 12 = ; 

n 1 + n 2 



bzw. dessen Realisation 



P 12 = 



nipi 4 - n 2 p2 
72 1 + 72 2 



statt 7Tj und erhält schließlich als approximativ normalverteilte Prüfgröße: 



D = 



Pi ~ P 2 

\/ P 12(1 — Pi2)((^i 4- 222)/(72 i 722)) 



Bei ungleichen Anteilswerten schätzt man 7Ti durch p\ und 7T2 durch p 2 - 



Aufgabe 4.2/1 Übertragen Sie die Begriffe Gütefunktion, a-Fehler und ß- 
Fehler aus dem Einstichprobenfall auf die Zweistichproben-Tests. 



Aufgabe 4.2/2 Für die Übernahmeprüfung von Kilorollen Kupferdraht 
wird folgende Regelung getroffen: Aus der jeweils gelieferten sehr umfang- 
reichen Partie wird eine Zufallsstichprobe mit n = 64 gezogen und de- 
ren Durchschnittsgewicht festgestellt. Können 2 gelieferte Partien dasselbe 
Durchschnittsgewicht haben, wenn bei der ersten ein Durchschnittsgewicht 
der Stichprobe von 998 g bei einer Standardabweichung von 4 g und bei der 
zweiten ein solches von 1000 g bei einer Standardabweichung von 3 g ermittelt 
wurde? 
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a) Begründen Sie ein geeignetes Entscheidungsmodell, formulieren Sie die 
Hypothesen und führen Sie den Test durch (a = 0.0455). 

b) Treffen Sie bei a=0.0455 eine Aussage über den Unterschied der Durch- 
schnittsgewichte beider Partien. 

c) Welche Verteilung kann für den Fall angewendet werden, daß die Stich- 
proben klein, die Grundgesamtheiten normal verteilt und die Varianzen 
bekannt sind? 



Aufgabe 4.2/3 Je 50 Studenten von 2 verschiedenen Hochschulen nahmen 
an derselben Statistik-Klausur teil und erzielten durchschnittliche Punktzah- 
len von 63 (Hochschule A) bzw. 72 (Hochschule B). Die Standardabweichung 
s der Klausurpunkte betrage 10 in beiden Fällen. 

a) Spricht dies signifikant (a=0.005) dafür, daß die Studenten der Hoch- 
schule B in Statistik besser sind als die der Hochschule A? 

b) Schätzen Sie den durchschnittlichen Punkteunterschied zwischen Studen- 
ten der Hochschule B und Studenten der Hochschule A bei einem Konfi- 
denzniveau von 0.9545. 



Aufgabe 4.2/4 Die Körpergrößen männlicher Einwohner der Länder A und 
B seien normalverteilt mit den Varianzen a 2 A — 5 cm 2 bzw. a B — 6 cm 2 . 
Mit Hilfe zweier Stichproben vom Umfang ua — 50 bzw. riß — 40 ist zu 
testen, ob herkunftsspezifische Größenunterschiede zwischen den männlichen 
Einwohnern beider Länder bestehen. 

a) Nennen Sie die Testhypothesen eines geeigneten Signifikanztests und be- 
stimmen Sie den Nichtablehnungsbereich für das 5%-Signifikanzniveau. 

b) Berechnen Sie die Wahrscheinlichkeit für den Fehler 2. Art, wenn die 
männlichen Einwohner von Land A durchschnittlich um 2 cm größer sind 
als die von Land B. 



Ergänzungen und Bemerkungen 

• Sind die Stichproben nicht unabhängig voneinander gezogen, liegen also 
zwei verbundene einfache Stichproben vor, so erhält man Testmodelle, 
indem man die Verfahren der Einstichprobentests auf die Differenzen = 

— Vi (i = 1, . . . , n) der n Beobachtungswerte (#,-, yi) anwendet. 

• Zum Vergleich zweier Anteilswerte bei kleinen Stichprobenumfängen, bei 
denen eine Approximation der Binomialverteilung durch die Normalver- 
teilung nicht erlaubt ist, vgl. Pfanzagl (1978) S.122 ff.. Diese Tests gehen 
auf R. A. Fisher zurück. 
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4.3 Vergleich von Varianzen 

Normalverteilte Grundgesamtheiten können sich lediglich durch unterschied- 
liche Mittelwerte und/oder unterschiedliche Varianzen unterscheiden. Nach- 
dem in Abschnitt 4.2.1 ein Test zum Vergleich von Mittelwerten vorgestellt 
wurde, soll nun ein Test zum Vergleich zweier Varianzen dargestellt werden. 

Dazu zieht man unabhängig voneinander zwei einfache Stichproben vom 
Umfang n\ bzw. n 2 aus zwei normalverteilten Grundgesamtheiten. Zur 
Überprüfung der Hypothesen 



i) 


H 0 :<t\ = a\. 


Hi : a\ ^ <t\ 


ü) 


H 0 : a\ < <t|, 


H i : er, > ei 


üi) 


Ho-<t\> 02, 


H\ : <r\ < <t\. 


bestimmt man die Stichprobenvarianzen und S% 2 _ 1 . Dann genügt die 



Prüfgröße 

einer F - Verteilung mit n, — 1 und n? — 1 Freiheitsgraden (vgl. Abschnitt 
2.12), d.h. 

Sh-i/S^-i ~ FV(ni - l,n 2 - 1), 

falls Ho gilt. 

Der Nicht-Ablehnungsbereich von Ho ergibt sich für die einzelnen Hy- 
pothesenpaare wie folgt: 

i) [l/*!_ a/2,n 2 — l,ni — 1 > **T — a/2,ni— l,n 2 — l] 

Ü [0 , — OfjTT-i — l,n 2 — l] 

Üi) [l/xi_a,n 2 -l, ni -l , OO), 

wobei xi- S}l/ltU2 für e—a bzw. e—a/2 das entsprechende Fraktil der F-Ver- 
teilung mit v\ und v 2 Freiheitsgraden bezeichnet (siehe Tabelle 5). 

Als Intervallschätzung für den Quotienten der Varianzen ergibt sich 
durch Umformung: 



1 



•*T — a/2,n 2 — l,ni — 1 




< «1 



— a/2,ni — l,n 2 — 1 



S 

S 



2 

J_ 

2 

2 



Aufgabe 4.3/1 Bestimmen Sie die kritischen Grenzen für die Prüfgröße 
Sn.-i/S^-i des Tests 



Hq \ a\ = <?l gegen H x : o\± a\ 
falls a — 0.1 eingehalten werden soll und falls gilt: 

a) n\ — — 9, 

b) m = 101 ,n 2 = 51. 
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Aufgabe 4.3/2 Bei einem Test auf Varianzhomogenität zweier Zufallsvari- 
abler werden Stichproben der ersten Variablen vom Umfang ni=8 und der 
zweiten Variablen vom Umfang ri2=7 gezogen. 

a) Welche Voraussetzungen an die Zufallsvariablen sind für die Durchfüh- 
rung des Tests notwendig? 

b) Geben Sie die Testhypothesen explizit an. 

c) Ist dies ein zwei-, links- oder rechtsseitiger Test? 

d) Fällen Sie die Testentscheidung für den Fall, daß s \ _i/s„ _ x =0.25 und 
<*= 0 . 1 . 



Ergänzungen und Bemerkungen 

• Die Begründung für die Verwendung der F - Verteilung beim Vergleich 
zweier Varianzen findet man in Abschnitt 2.12. Die Zufallsvariablen 
Sn t -i/ (T i s ^ n( ^ nämlich unabhängig und x 2 V(rii — l)-verteilt (vgl. 3.6), 
ihr Quotient also F-verteilt. 

• Der hier vorgestellte F-Test zum Vergleich von zwei Grundgesamtheitsva- 
rianzen ist nicht sehr robust gegenüber Abweichungen von der Normalver- 
teilungsannahme. Pflanzagl (1978), S.201, bzw. Kreyszig (1979), S.226, 
stellen einen Test zum Vergleich von Varianzen vor, falls Anhaltspunkte 
vorliegen, daß die Normalverteilungsannahme verletzt ist. 



4.4 Homogenitäts- und Unabhängigkeitstests 

4.4.1 Homogenitätstest 

In Abschnitt 3.11 haben wir uns mit der Frage beschäftigt, ob eine bestimmte 
Zufallsvariable in einer Grundgesamtheit eine in der Nullhypothese spezifi- 
zierte Verteilung aufweist. Während man bei diesen Anpassungstests jeweils 
eine Stichprobe betrachtet, stellen wir uns nun die Frage, wie sich zwei oder 
mehr unabhängige Stichproben vermöge ihrer empirischen Verteilungen dar- 
aufhin testen lassen, ob sie aus (bezüglich des beobachteten nominalskalier- 
ten Merkmals) identisch verteilten Grundgesamtheiten stammen ( homogene 
Grundgesamtheiten). Wir stellen uns z.B. die Frage, ob die Angehörigen ver- 
schiedener Konfessionen sich bezüglich ihrer Gottesdienstbesuchshäufigkeit 
als zur selben Grund gesamtheit zugehörig aufgefaßt werden können (Nullhy- 
pothese H o: Stichproben stammen aus homogenen (gleichen) Grundgesamt- 
heiten). Die beobachteten absoluten Häufigkeiten faßt man in einer Kontin- 
genztabelle zusammen: 
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1 


Nr. 1 
evange- 
lisch 


Stichproben 
Nr. 2 ... 

katho- 
lisch 


Nr. s 
andere 
Rel.Gem. 


Ylj n ij 


A\ ‘immer’ 


nn 


n\2 




n\s 


ni. 


A 2 ‘häufig’ 


n 2 \ 


ri22 




n 2 s 


n 2 . 


A r ‘nie’ 


n r 1 


n r 2 




nrs 


7%r . 


Ei n a 


n. 1 


n.2 




n.s 


n 



Dabei steht Y für das Merkmal „Häufigkeit der Gottesdienstbesuche“ und 
hat r (z = l,...,r) Ausprägungen. Für jede Merkmalsausprägung Xj 
(j = l,...,s) des Merkmals X=„ Konfession“ wird eine einfache Stichpro- 
be gezogen, so daß s Stichproben vorliegen. n i; bezeichnet dann die Anzahl 
der Beobachtungen mit der Merkmalsausprägung A{ in der Stichprobe j (die 
der Merkmalsausprägung Xj entspricht). Um zu einer Testentscheidung zu 
gelangen, sind zunächst die Werte zu ermitteln, die unter Gültigkeit der 
Nullhypothese für die Stichproben als Stichprobenwerte auftreten würden. 
Man macht sich leicht klar, daß unter Gültigkeit von Hq für die Stichpro- 
ben die absoluten Häufigkeiten n,\ im Verhältnis n.i : n .2 : : n s auf die 

einzelnen Stichproben aufgeteilt sein müssen. Wählt man als Maß für die 
Abweichung der beobachteten von den errechneten Werten die quadratische 
Kontingenz (vgl. 1.4.1) 



1=1 j=l 



ijl ij Kij ) 2 



so gilt: die entsprechende Testgröße ist approximativ x 2 -verteilt mit (r — 
l)(s— 1) Freiheitsgraden. Sie eignet sich zur Testentscheidung für die formu- 
lierte Nullhypothese. 



4.4.2 Unabhängigkeitstest 

Interpretiert man in der Kontingenz tabeile in 4.4.1 die Spalten j = 1, . . . , s 
ebenfalls als Merkmalsausprägungen eines nominalskalierten Merkmals, so 
kann man danach fragen, ob die den Merkmalen „Häufigkeit der Gottesdienst- 
besuche“ (y) und „Konfession“ (X) zugeordneten Zufallsvariablen voneinan- 
der unabhängig sind. Wir unterstellen dabei, daß die Merkmalsträger zu einer 
zweidimensionalen Grundgesamtheit gehören (d.h. eine zweidimensionale ein- 
fache Stichprobe liegt vor). Man kann das auch so formulieren, daß wir in 
zwei verbundenen einfachen Stichproben vom Umfang n zwei Merkmale X 
und y mit den Ausprägungen x, (i = 1, . . . , s) und yj (j = 1, . . . , r) erheben 
und einen Test suchen für die Nullhypothese Ho : X und Y sind unabhängig. 
Unter Gültigkeit von Hq für die Stichproben ermitteln sich die errechneten 
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Werte hij = ni ji j/n. Als Abweichungsmaß dient wiederum die quadratische 
Kontingenz 



* = 1 j=l 



(riij - hij ) 2 



Die entsprechende Prüfgröße ist approximativ x 2 -verteilt mit (r — l)(s — 1) 
Freiheitsgraden. Dabei sollte allerdings > 5 für alle i = 1 und 

j = 1, . . . ,s gelten. Im Falle der Nichtablehnung von Ho bedeutet dies im 
oben angeführten Beispiel, daß die Hypothese „Konfession und Häufigkeit von 
Gottesdienstbesuchen sind unabhängige Merkmale“ beibehalten wird und da- 
mit homogene Grundgesamtheiten unterstellt werden dürfen. 



Aufgabe 4.4/1 

a) Erläutern Sie Zusammenhänge und Unterschiede zwischen 

• x 2 -Anpassungstest 

• x 2 -Homogenitätstest und 

• X 2 -Unabhängigkeitstest. 

b) Welches Skalenniveau setzen die verschiedenen x 2 -Tests voraus? 

c) Welche Werte kann die für die verschiedenen x 2- Tests herangezogene 
Prüfgröße annehmen? Wann spricht man jeweils von einer signifikanten 
Abweichung von der Nullhypothese? Welchen Einfluß haben die Vergröße- 
rung des Stichprobenumfangs sowie die Erhöhung der Zahl der möglichen 
Merkmalsausprägungen (also der Zahlen s und r) auf die Testentschei- 
dung? 



Aufgabe 4.4/2 Bei einer Umfrage antworteten von je 955 zufällig aus- 
gewählten Deutschen bzw. Italienern auf die Frage „Verfolgen Sie das po- 
litische Geschehen?“ 





regelmäßig 


ab und zu 


nie 


weiß nicht 


D 


325 


363 


239 


28 


I 


105 


248 


592 


10 



(Nach Greifenhagen, M. und S.: Ein schwieriges Vaterland. München (1979) 
S. 337) 

Sind aufgrund dieser Umfrageergebnisse „Nationalität“ und „Interesse am 
politischen Geschehen“ für a=0.05 als unabhängige Merkmale anzusehen? 



Aufgabe 4.4/3 Bei einer Umfrage erklären 300 von 500 befragten Perso- 
nen, daß sie ihre Stimmabgabe bei der nächsten Wahl auch von den Aussagen 




148 



der Parteien zur fortschreitenden Umweltzerstörung abhängig machen wol- 
len. Von den 500 befragten Personen wohnen 300 in industriellen Ballungs- 
gebieten. Von den anderen befragten Personen, die in ländlichen Gegenden 
wohnen, bejahten 100 Personen die Frage nach der Bedeutung der Aussagen 
zur Umweltzerstörung für ihr Wahlverhalten. 

a) Erstellen Sie die Kontingenztabelle (nach Definition entsprechender Zu- 
fallsvariabler X und Y). 

b) Testen Sie, ob X und Y unabhängig sind (a = 0.05). 

c) Welche Schlüsse lassen sich aus dem Testergebnis von b) ziehen? 



Ergänzungen und Bemerkungen 

• Im Falle kardinalskalierter Merkmale kann prinzipiell der x 2 -Unabhängig- 
keitstest nach Gruppierung der Merkmalsausprägungen angewandt wer- 
den. Allerdings gehen dabei Informationen über die Merkmalsausprägun- 
gen verloren. Anstelle eines x 2 -T es ts ist deshalb die Verwendung von 
Konfidenzintervallen für Differenzen von Mittelwerten für kardinalska- 
lierte Merkmale vorzuziehen (vgl. hierzu Wonnacott/Wonnacott (1977), 
Kapitel 7.2). Zur Problematik der Konstruktion simultaner Konfidenzin- 
tervalle sei auf Pruscha (1989), Kapitel HI. 5, verwiesen. 

• Das Problem „statistische Signifikanz“ — „praktische Relevanz“ stellt sich 
beim x 2 -Test besonders: Für große Stichproben erhält man als Testent- 
scheidung fast immer die Verwerfung von Ho. 



4.5 Grundlagen der Varianzanalyse 

Nachdem wir in Abschnitt 3.8.1 einen Test für den Mittelwert einer Grund- 
gesamtheit und in Abschnitt 4.2.1 Tests für die Differenz zweier Mittelwerte 
aufgrund der Ergebnisse zweier Stichproben kennengelernt haben, wollen wir 
uns in diesem Abschnitt mit dem Vergleich von r (r > 2) Grundgesamt- 
heitsmittelwerten aufgrund von r vorliegenden Stichproben beschäftigen. 

Wir gehen dabei von folgenden Voraussetzungen aus: 

• Wir ziehen unabhängig voneinander jeweils eine einfache Stichprobe aus 
r (r > 2) Grundgesamtheiten. Dazu bezeichnen wir die entsprechenden 
Stichprobenumfänge mit ni, . . . , n r . 

• Wir interessieren uns jeweils für ein kardinalskaliertes Merkmal X , von 
dem wir voraussetzen, daß es in allen r Grundgesamtheiten annähernd 
normalverteilt ist mit der gleichen Varianz <r 2 (Normalverteilungsan- 
nahme und Varianzhomogenität). Die Kenntnis der Grundgesamtheits- 
varianz ist nicht erforderlich. 
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Bezeichnen wir mit // t - den Grundgesamtheitsmittelwert der i-ten Grundge- 
samtheit (i = 1 , . . . , r), so lauten die zu testenden Hypothesen 

#o • = V2 = • • . = t*r ; Hi : Es gibt ij mit ^ fij . 

Beispiele für Fragestellungen dieser Art sind die Analyse der Auswirkungen 
verschiedener Werbemaßnahmen auf den Wochenumsatz X eines Unterneh- 
mens (r Werbemaßnahmen werden für jeweils eine Zeitperiode eingesetzt 
und es wird geprüft, ob die durchschnittlichen Wochenumsätze in den r Peri- 
oden signifikant voneinander abweichen) oder die Auswirkungen verschiede- 
ner Düngemethoden auf den Ernteertrag. 

Zur Testentscheidung wählen wir folgendes Test verfahren, das (aufgrund 
der herangezogenen Prüfgröße) Varianz an alyse genannt wird. 

• Wir zerlegen die Abweichungsquadratsumme 

«=i >=i 

in zwei Komponenten q\ und <72 : 

r n t r 

Ql = ^]Ö X *J " x *) 2 ’ 52 = ”<(*•' “ *) 2 - 

*=lj=l *=1 



Dabei ist 

1 n * 

Xi = — Y ]xij, i = l,...,r 
ni f-f 
j = i 

das arithmetische Mittel der Stichprobe Nr. i und 



1 _ 
= - > riiXi 
n 



i= 1 



der Gesamtstichprobenmittelwert (wobei n = £^ = 1 n t - gesetzt wurde). 
Offensichtlich gilt q = qi + <72 (Streuungszerlegungssatz). Dabei ist q\ ein 
Maß für die Streuung in den Stichproben (interne Streuung) und q 2 ein 
Maß für die Streuung zwischen den Stichproben (externe Streuung). 

• Als Prüfgröße wählt man 




Die entsprechende Stichprobenfunktion ist bei Gültigkeit der Nullhypo- 
these F - verteilt mit r-1 und n-r Freiheitsgraden. 




150 



• Die Vorgabe eines Signifikanzniveaus a erlaubt mit Hilfe des entsprechen- 
den Wertes aus der F- Verteilung die Festlegung des Ablehnungsbereiches 
von H o (rechtsseitiger Test). 



Aufgabe 4.5/1 

a) Wozu dient die Varianzanalyse und worauf deutet ihr Name hin? 

b) Diskutieren Sie die in der Varianz an alyse verwendete Prüfgröße. Welche 

Werte kann diese annehmen? Warum eignet sie sich zur Überprüfung der 
Hypothese Hq : = fi 2 — • • = A*r? 



Aufgabe 4.5/2 Eine Automobilzeitschrift testet je 5 Exemplare von 4 ver- 
schiedenen Hochgeschwindigkeitsreifenfabrikaten auf maximale Belastbar- 
keit. Die folgende Tabelle gibt an, bei welcher Stundengeschwindigkeit der 
jeweilige Reifen platzte: 





1 


2 


3 


4 


5 


1 


216 


228 


167 


198 


203 


2 


195 


187 


197 


193 


217 


3 


148 


169 


223 


201 


163 


4 


211 


158 


178 


177 


169 



Haben die verschiedenen Reifentypen auf einem Niveau von 0.05 eine signifi- 
kant unterschiedliche Belastbarkeit? 



Aufgabe 4.5/3 Die folgende Tabelle gibt die Ergebnisse einer Zufallsstich- 
probe zur Ermittlung der Quadratmeterpreise (in DM) für Studentenzimmer 
in vier westfalischen Hochschulstädten wieder: 



Ort 


Quadratmeterpreis 


A 


8 


14 


B 


13 


9 


C 


7 


14 8 7 


D 


7 


7 16 



a) Besteht ein signifikanter Unterschied in den durchschnittlichen Quadrat- 
meterpreisen zwischen den vier Städten (a=0.05)? Formulieren Sie die 
Hypothesen des Tests exakt und interpretieren Sie Ihr Ergebnis. 

b) Welche Voraussetzungen haben Sie bei der Durchführung des Testverfah- 
rens zu a) unterstellt? 
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Ergänzungen und Bemerkungen 

• Betrachten wir das Beispiel „Wochenumsatz eines Unternehmens“. Jede 
Stichprobe sei eindeutig einer Werbemaßnahme zugeordnet. Ordnen wir 
dem Merkmal „Werbemaßnahme“ die Zufallsvariable X mit entsprechen- 
den r Ausprägungen zu, so sehen wir, daß wir die Varianz an alyse auch als 
eine Methode zur Überprüfung der Abhängigkeit eines kardinalskalierten 
Merkmals Y von einem nominalskalierten Merkmal X auffassen können 
(entsprechend dem Zusammenhang zwischen Homogenitätstest und Un- 
abhängigkeitstest im Falle zweier nominalskalierter Merkmale, den wir 
in Abschnitt 4.4 behandelten). Allerdings setzt eine solche Interpreta- 
tion eine der Varianz an alyse vorausgehende Klärung der Frage nach der 
Richtung der Abhängigkeit voraus. 

• Das von uns vorgestellte varianzanalytische Modell wird in der Literatur 
als einfache Varianzanalyse bezeichnet. Im Rahmen der doppelten Va- 
rianzanalyse lassen sich zwei nominalskalierte Merkmale als „erklärende 
Variable“ für die Variabilität des kardinalskalierten Merkmals Y analy- 
sieren (zu Einzelheiten vgl. Ahrens (1968) oder Ritsert/Stracke/Heider 
(1976)). 

• Für den Fall r= 2 ergibt die einfache Varianz analyse die gleiche Testent- 
scheidung wie der Differenzentest für Mittelwerte. 

• Die Varianz analyse wurde von R. A. Fisher entwickelt. 



4.6 Lineare Regression: Schätz- und Testpro- 
bleme 

Bereits in den Abschnitten 4.4.2 und 4.5 haben wir uns mit Fragen der 
Abhängigkeit zwischen zwei Zufallsvariablen X und Y, die jeweils einem ein- 
dimensionalen Merkmal zugeordnet waren, beschäftigt: 

• Beim x 2 -Unabhängigkeitstest wurde nach dem Zusammenhang zwischen 
zwei nominalskalierten Merkmalen gefragt. 

• Bei der einfachen Varianzanalyse wurde die Abhängigkeit eines kardinal- 
skalierten Merkmals von einem nominalskalierten Merkmal untersucht. 

Zur Analyse der Abhängigkeit eines kardinalskalierten Merkmals Y von einem 
weiteren kardinalskalierten Merkmal X (z.B. Abhängigkeit der Ausgaben ei- 
nes Zweipersonenhaushalts für Freizeit und Urlaub vom verfügbaren Haus- 
haltseinkommen) bieten sich Methoden aus der Regressionsrechnung an. Ein 
entsprechendes Modell, das man als lineares ökonometrisches Eingleichungs- 
modell (lineares Regressionsmodell) bezeichnet, soll im folgenden schrittweise 
anhand eines Beispiels entwickelt werden: 
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• Die Höhe der Ausgaben eines Zweipersonenhaushalts Y für Freizeit und 
Urlaub hängen nicht deterministisch von der Höhe des verfügbaren Haus- 
haltseinkommens X ab. Für ein bestimmtes verfügbares Einkommen X{ 
werden im allgemeinen verschiedene y,- Werte beobachtbar sein, weil ne- 
ben dem verfügbaren Haushaltseinkommen eine Reihe weiterer Faktoren 
die Entscheidung der Mitglieder eines Zweipersonenhaushalts über die 
Höhe der Freizeitausgaben beeinflussen (Wetter, Gesundheit der Fami- 
lienmitglieder usw.). Ein beobachtetes Wertepaar ( X{,yi ) läßt sich also 
als Stichprobe vom Umfang 1 aus der Grundgesamtheit „Ausgaben ei- 
nes Zweipersonenhaushalts für Freizeit und Urlaub, wenn das verfügbare 
Haushaltseinkommen Xi beträgt“ auffassen: Yi ist also eine Zufallsvariab- 
le, die Werte X{ sind feste Größen. Für jeden Wert Xi existieren mehrere 
mögliche Werte y*. Wir setzen voraus, daß die bedingten Verteilungen 
W(Yi\xi) die gleiche Varianz <r 2 für alle Werte Xi haben . 

• Wir setzen weiter voraus, daß die Zufallsvariable Yi (endogene Varia- 
ble) linear vom Wert X{ (exogene Variable) und einer Störvariablen Ui 
abhängt, die die sonstigen Einflüsse auf die Entscheidung über die Höhe 
der Freizeit ausgaben zusammenfassen soll: 



Y{ — ß o 4 ß\Xi 4 Ui. 



# Von den Störvariablen Ui wollen wir weiter voraussetzen, daß sie keinen 
systematischen Einfluß auf Yi ausüben, sondern eine rein stochastische 
Größe im Modell darstellen. Wir präzisieren dies durch folgende Bedin- 
gung: 



E(Ui) = 0 für i — 1, . . . , n 

V(Ui) = <t 2 für i — 1, . . . , n (Bedingung der Homoskedastie) 

Cov(U i, Uj) = 0 für z, j = 1 ,...,n und i ^ j (keine Autokorrelation). 



Liegen nun n Beobachtungswerte (x;, y t ) (z = 1, . . . , n) vor, so stellt sich das 
Problem der Schätzung der sogenannten Regressionskoeffizienten ßo und ßi . 
Die Anwendung der Kleinst-Quadrate-Methode (man bestimme ßo und ß\ 
so, daß ^r=i(2/* — ßo — ß\%i ) 2 minimal ist!) liefert Punktschätzungen ßo und 
ßi für ßo bzw. ßi und damit für die Regressionsgleichung Y = ßo 4 ß\x der 
Grundgesamtheit. Die entsprechenden Schätzfunktionen Bo und B\ lauten: 



Bq — Y — B\x, B\ 






Beide sind lineare Schätzfunktionen in den Stichprobenvariablen Yi . Weiter- 
hin gelten die folgenden Eigenschaften: 



• E(Bo) = ßo und ü^i) = ßi, 

d.h. die Schätzfunktionen sind erwartungstreu. 
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• V(B 0 ) - <T 2 x 2 /(ns 2 x ) mit x 2 = und s l = £E"=i (*< - *) 2 - 

. l/(ß 1 ) = <r 2 /(n S 2 ) . 

• Die Effizienz der Schätzfunktionen steigt mit wachsendem Stichproben- 
umfang und abnehmender Varianz der Störvariablen {/,*. 

• Die Bedeutung der Kleinst-Quadrate-Methode zur Schätzung der Regres- 
sionskoeffizienten ß Q und ß\ wird durch das sogenannte Gauß-Markoff- 
Theorem deutlich. Für einen festen Stichprobenumfang n gilt: Die 
Kleinst-Quadrate-Schätzfunktion Bo bzw. B\ weist in der Klasse aller 
linearen erwartungstreuen Schätzfunktionen für den Regressionskoeffizi- 
enten ßo bzw. ßi minimale Varianz auf, d.h. Bo bzw. Bi sind effizient 
in dieser Klasse von Schätzfunktionen. Gilt zusätzlich die Normalvertei- 
lungsannahme Ui ~ NV( 0,<r), so sind die Schätzfunktionen Bo und B\ 
effizient in der Klasse aller erwartungtreuen Schätzfunktionen für ßo und 
ßi- 



Setzt man nun zusätzlich zu den oben gemachten Voraussetzungen voraus, 
daß die Ui normalverteilt sind (d.h. Ui ~ W(0,<r)), so lassen sich weitere 
Aussagen über die Verteilung der ßi- Werte machen und daraus Konfidenzin- 
tervalle sowie Test verfahren für die Regressionskoeffizienten ßo bzw. ß\ kon- 
struieren: 

i = 0, i 

~ SV(n - 2), j = 0, 1 



S 2 - 



Bo ~ 



nsi 



1=1 x 1=1 



Ferner ist ^? =1 (7//<7 2 X 2 ~ ver f e ilt mit n_ 2 Freiheitsgraden. Man kann also 
die Störvarianz <r 2 einerseits erwartungstreu durch U 2 schätzen und 

andererseits Konfidenzintervalle mit Hilfe der x 2 V(n — 2)- Verteilung konstru- 
ieren. 



Aufgabe 4.6/1 

a) Nennen und diskutieren Sie die Grundannahmen eines linearen Regressi- 
onsmodells. 

b) Welche Gütekriterien können zur Beurteilung von Punktschätzungen her- 
angezogen werden? 

c) Diskutieren Sie folgende Aussagen: 

• Auch im Falle kardinalskalierter Merkmale kann der x 2 -Unabhängig- 
keitstest angewandt werden. 
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• X 2 -Unabhängigkeitstest, Varianz an alyse und die Methode der linearen 
Einfachregression beantworten verwandte Fragestellungen. 

# Die Kleinst-Quadrate-Methode liefert die besten Schätzwerte für die 
Regressionskoeffizienten. 



Aufgabe 4.6/2 

a) Zeigen Sie, daß gilt: 

♦ V(Ui) = a 2 => V{Yi) = <t 2 

• E(Yi) = ßo + ßixi. 

b) Bei der Ableitung des Modells haben wir vorausgesetzt, daß die Werte 
verschieden sind, und dadurch garantiert, daß s 2 > 0 gilt. Warum ist die 
Bedingung s 2 > 0 notwendig? Was passiert, wenn s 2 « 0? 



Aufgabe 4.6/3 Zwischen der Lärmemission bei Autos (gemessen in dB(A)) 
und der Fahrgeschwindigkeit von Autos (gemessen in km/h) wird eine lineare 
Abhängigkeit unterstellt. Messungen vorbeifahrender Pkw’s gleichen Typs 
ergaben folgende Resultate: 

(25,50), (45,60), (85,80), (55,60), (55,80), (95,80), (95,90), (75,75), (25,65), 

(45,60). 

a) Legen Sie für eine Regressionsanalyse abhängige und unabhängige Varia- 
ble fest. 

b) Ermitteln Sie aufgrund der vorliegenden Messungen Schätzwerte für die 
Regressionskoeffizienten der Regressionsgleichung Y = ßo -f ß\x (Inter- 
pretation). 

c) Welche Güteeigenschaften besitzt das von Ihnen gewählte Schätzverfahren 
(unter welchen Voraussetzungen)? 

d) Läßt sich aufgrund der vorliegenden Messungen die Hypothese ß\ = 0 
testen? 



Ergänzungen und Bemerkungen 

• Mit Hilfe des Vektor- und Matrizenkalküls lassen sich lineare Abhängig- 
keiten zwischen einer kardinalskalierten Zufallsvariablen Y und mehreren 
kardinalskalierten Variablen Xi erfassen und in einem multiplen Regressi- 
onsmodell die von uns dargestellten Methoden der linearen Einfachregres- 
sion verallgemeinern. Das Gauß- Mark off-Theorem ist auch im Rahmen 
eines multiplen Regressionsmodells gültig (vgl. Schneeweiß (1978), Kapi- 
tel 2, Bamberg/Schittko (1979), Teil I, oder Hübler (1989), IV). 
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• Im Rahmen der Ökonometrie sind auch Verfahren entwickelt worden, um 
die lineare Abhängigkeit mehrerer zu erklärender Variablen Yi, . . . , Y n von 
mehreren erklärenden Variablen X \, . . . , X m in sogenannten ökonometri- 
schen Mehrgleichungsmodellen zu erfassen und entsprechende Koeffizien- 
ten zu schätzen. Darüberhinaus werden auch nicht-lineare Beziehungen 
zwischen Variablen untersucht. 

• Bisher wurde vorausgesetzt, daß die Variable X kardinalskaliert ist. 
Man kann jedoch für die unabhängigen (exogenen) Variablen auch di- 
chotome Variablen (Indikatorvariablen) zulassen (sogenannte „Dummy- 
Variablen“), um z.B. Strukturbrüchen in Zeitreihen Rechnung zu tragen. 
Es besteht Äquivalenz zwischen linearer Einfachregression mit einer In- 
dikatorvariablen, einfacher Varianz an alyse bei zwei Stichproben und dem 
Zwei-Stichproben-Test bei Varianzhomogenität. 

• Das Regressions modell ist auch anwendbar, wenn die x, -Werte Realisa- 
tionen einer Zufallsvariablen X sind. 



4.7 Korrelation: Punktschätzung für g 

Während wir im Rahmen der linearen Regressionsmodelle die Abhängigkeit 
einer Zufallsvariablen Y von festen Werten Xi der exogenen Variablen X 
untersuchten, wollen wir nun den Zusammenhang zwischen zwei Zufallsvari- 
ablen studieren. Dabei behandeln wir beide Zufallsvariablen als gleichrangig, 
d.h. keine von beiden wird als „Erklärende“ der anderen ausgezeichnet. Als 
Maß für die lineare Beziehung zwischen zwei Zufallsvariablen X und Y ver- 
wenden wir dabei den in Abschnitt 1.4.3 eingeführten Korrelationskoeffizien- 
ten 

<?XY 

Q = > 

(Txcry 

wobei (Txy die Kovarianz von X und Y und crx bzw. cry die Standardabwei- 
chung der jeweiligen Randverteilung von X bzw. Y in der Grundgesamtheit 
bezeichnen. 

Um q zu schätzen, betrachten wir zwei verbundene einfache Stichpro- 
ben vom Umfang n der jeweiligen Variablen aus der Grundgesamtheit, d.h. n 
Beobachtungen (xi, yi), . . . , (x n , y n ) der zweidimensionalen Zufallsvariablen 
(X, Y), und berechnen den Korrelationskoeffizienten für die Stichprobe : 

r- ELlfo - *)(»> - y) _ _fry_ 

VU=i(xi-*)WZU(yi-y) 2 »«V 

Zur Punktschätzung verwendet man dann die entsprechende Stichproben- 
funktion 

R( X ,Y) = - X)(Yj - Y) = Sxr 

VE^-^VE^iW-n 2 
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d.h. man erhält als Punktschätzung g = r. Es läßt sich zeigen, daß R im 
allgemeinen nicht erwartungstreu, wohl aber konsistent ist. 

Bekanntlich läßt sich der Bestimmtheitskoeffizient g 2 leicht interpretie- 
ren: (100 -g 2 )% der Variation der einen Variablen lassen sich durch die lineare 
Beziehung mit der anderen Variablen erklären. Es liegt deshalb nahe, R? als 
Schätzfunktion zur Punktschätzung von g 2 zu verwenden. Aber auch R 2 ist 
im allgemeinen nicht erwartungstreu, wenn auch für genügend große Stich- 
probenumfänge mit nur kleinen Verzerrungen gerechnet werden muß. 

Aufgabe 4.7/1 Aus welchem Grund hat die Korrelationsanalyse für eine 
zweidimensional normalverteilte Grundgesamtheit eine besondere Bedeu- 
tung? 



Aufgabe 4.7/2 Laut einer Meldung der Süddeutschen Zeitung vom 29. 4. 81 
gelten „. . . ein hoher Beschäftigungsstand und relative Preisstabilität . . . heute 
überwiegend als wirtschaftspolitische Ziele, die am besten im Verbund — und 
nicht im wechselseitigen Austausch — anzustreben sind“. 

Ein Vergleich einiger großer Industrieländer ergibt (gemessen als Monatswerte 
im Vorjahres vergleich in Prozent) folgende Ergebnisse: 





Preissteigerung 


Arbeitslosigkeit 


BR Deutschland 


5.5 


5.2 


Schweiz 


6.0 


0.2 


Japan 


6.5 


2.2 


Niederlande 


6.5 


2.2 


Österreich 


6.7 


3.7 


USA 


6.7 


3.7 


Großbritannien 


12.5 


10.3 


Frankreich 


12.7 


7.4 


Schweden 


14.6 


2.5 


Italien 


19.5 


8.8 



a) Geben Sie eine Punktschätzung für den Korrelationskoeffizienten der 
Grundgesamtheit aufgrund dieser Stichprobe an. 

b) Welche Schlüsse läßt diese Schätzung zu? 

c) Welche Aussagen lassen sich bezüglich der Güte des gewählten Schätzver- 
fahrens machen? 

d) Legt der zitierte Kommentar der Süddeutschen Zeitung die Verwendung 
eines Korrelations- oder eines Regressionsmodells zur statistischen Ana- 
lyse nahe? 



Aufgabe 4.7/3 Die Zufallsvariable Y sei definiert durch Y = 4 — X und es 
gelte E(X) = 4. 
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a) Bestimmen Sie E(X + Y). 

b) Welche der folgenden Aussagen sind wahr und welche falsch? 
bl) Cov(X,Y) > 0. 

b2) (Cov(X,Y)) 2 = V{X)V{Y). 
b3) V(Y) = V(X). 
b4) 0=1. 



Ergänzungen und Bemerkungen 

• Ist die Grundgesamtheit zweidimensional normalverteilt , so lassen sich — 
nach auf R.A. Fisher zurückgehenden, 1915 veröffentlichten Methoden — 
Signifikanztests und Konfidenzintervalle für den Korrelationskoeffizienten 
konstruieren (vgl. Wonnacott/Wonnacott (1977), Kapitel 12). Für ent- 
sprechende Signifikanztests bei nicht-normalverteilter Grundgesamtheit 
sei auf Kowalski (1972) verwiesen. 

• Zusammenhänge zwischen Korrelation und Regression werden ausführlich 
diskutiert in Wonnacott/Wonnacott (1977), Abschnitt 14-2 (vgl. auch 
Warren (1971), sowie Pfanzagl (1974), Kapitel 10). 

• Wie sich die einfache Regressionsanalyse zur multiplen Regressionsanalyse 
erweitern läßt, können auch im Rahmen eines Korrelationsmodells lineare 
Abhängigkeiten zwischen mehr als zwei Variablen (hier: Zufallsvariablen) 
mit Hilfe sogenannter partieller und multipler Korrelationskoeffizienten 
analysiert werden (vgl. hierzu Wonnacott/Wonnacott (1977), Abschnitt 
14-3). 



• Mit der Korrelationsanalyse bei mehr als zwei Variablen haben wir ein 
Verfahren erwähnt, das zu den sogenannten muliivariaien Verfahren 
zählt. Multivariate Verfahren haben im Bereich der empirischen Sozi- 
alforschung (z.B. Psychologie, Pädagogik) und in den Wirtschaftswissen- 
schaften (insbesondere im Marketingbereich) große Bedeutung gewonnen. 
Vgl. dazu z.B. König (1974), Opitz (1978, 1989), Hüttner (1979). 

• Methoden der Korrelationsanalyse finden auch Anwendung zur Überprü- 
fung der Güte empirischer Untersuchungen. Sowohl zur Messung der 
Reliabilität (wie genau erfaßt das verwendete Verfahren die analysierte 
Größe?) als auch zur Messung der Validität (wird durch das verwendete 
Verfahren die Größe tatsächlich erfaßt, die erfaßt werden soll?) findet 
der Korrelationskoeffizient Verwendung (vgl. Huber/Schmerkotte (1976) 
sowie den Band 26 des „Journal of Marketing Research“, Februar (1979)). 




Kapitel 5 

Entscheidungstheorie und 
Statistik 



Wir haben bereits mehrfach auf die Bedeutung entscheidungstheoretischer 
Konzepte für die Statistik hingewiesen: 

• zur Einbeziehung von Informationen über die Konsequenzen von Fehl- 
entscheidungen bereits bei der Auswahl eines adäquaten statistischen 
Schlußverfahrens, 

• zur Beurteilung verschiedener Schätz- und Test verfahren. 

Darüber hinaus haben entscheidungstheoretische Modelle ihre Bedeutung 
in der Strukturierung und Analyse von Wahlhandlungsproblemen in einer 
Reihe von Disziplinen: der Volkswirtschaftslehre (z.B. im Rahmen der So- 
zialen Wahlhandlungstheorie, in der Mikroökonomik oder bei wirtschafts- 
politischen Fragestellungen) oder der Betriebswirtschaftslehre (z.B. in der 
Unternehmensforschung oder im Rahmen der Portfoliotheorie). 

Die folgende Einführung in die Grundbegriffe der Entscheidungstheorie 
soll deshalb zum einen eine Reihe von statistischen Fragestellungen, die wir 
in den vorangegangenen Kapiteln kennengelernt haben, neu beleuchten und 
Zusammenhänge zwischen ihnen aufdecken helfen; zum anderen soll die Ver- 
zahnung zwischen der Statistik und anderen Fachdisziplinen auch im metho- 
dischen Bereich durch die Vorstellung eines idealtypischen Referenzmodelles 
für Entscheidungssituationen unter Unsicherheit betont werden. 

5.1 Entscheidungstheoretische Modelle 

5.1.1 Das entscheidungstheoretische Grundmodell 

Das entscheidungstheoretische Grundmodell läßt sich beschreiben durch fol- 
gende Konzepte. 
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• Die Menge Z. aller für einen Entscheidenden relevanten „Umweltzustän- 
de“: Z heißt Zustandsraum. Als Umweltzustände bezeichnet man in die- 
sem Zusammenhang alle die Faktoren eines Entscheidungsproblems, die 
einerseits die Konsequenzen einer Entscheidung mit beeinflussen, aber an- 
dererseits der direkten Kontrolle durch den Entscheidenden entzogen sind. 
Es wird vorausgesetzt, daß die relevanten, sich gegenseitig ausschließen- 
den Umweltzustände dem Entscheidenden bekannt sind. 

• Die Menge A der für den Entscheidenden in der Entscheidungssituation 
möglichen Aktionen : den Aktionenraum. Auch hier wird vorausgesetzt, 
daß A alle in Betracht kommenden sich gegenseitig ausschließenden Hand- 
lungsmöglichkeiten des Entscheidenden umfaßt. 

• Die Zuordnung g einer Konsequenz R zu jedem Paar (z, a) E Z x A durch 
den Entscheidenden. 

Zustandsraum, Aktionenraum und Konsequenzen lassen sich im Falle end- 
licher Mengen Z sowie A übersichtlich in Form der sogenannten Konse- 
quenzenmatrix darstellen: 





Zl 


Z2 


Zk 


öl 


Rn 


Rl2 


• ‘ Rlk 




R 21 


R22 


* ' R2k 


Q>t n 


Rml 


Rm2 


Rmk 



Rn 

\ Rml 



Rlk 



Rmk 



• Die Bewertung U(g(z,a)), (z,a) E Z x A, der Konsequenzen durch den 
Entscheidenden aufgrund eines vorliegenden Zielsystems bzw. von Präfe- 
renzvorstellungen bzgl. der Konsequenzen: die subjektive Nutzenbewer- 
tung . Wir setzen dabei voraus, daß die Nutzenmessung durch den Ent- 
scheidenden die Festlegung einer kardinalen Nutzenfunktion U erlaubt. 
Im Falle endlicher Mengen Z und A schreiben wir U{j — U(Rij) = 
U(g(zj , a,*)). Die Matrix 





Z\ 


Zk 


U u 


di 


U n ■ 


•• Ulk 

bzw. 


d m 


Uml ■ 


" * Umk 


Uml 



Uik \ 
Umk ) 



heißt (subjektive) Nützlichkeitsmatrix oder Nutzenmatrix. Mit ihrer Hilfe 
lassen sich die verschiedenen Konsequenzen Rij vergleichen. 



• Die Angabe eines Entscheidungskriteriums , mit dessen Hilfe der Entschei- 
dende — aufgrund der gegebenen Nutzenordnung der Konsequenzen sowie 
Informationen über das Eintreten oder Vorliegen verschiedener Umwelt- 
zustände — eine Präferenzordnung der Handlungen a,* ableiten kann. 
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• Die Rationalitätsannahme, d.h. der Entscheidende wählt die Handlung, 
die in der abgeleiteten Präferenzordnung die höchste Stelle einnimmt. 

5.1.2 Klassifikationen 

Es lassen sich nun eine Reihe von Kriterien anführen, die zu unterschiedli- 
chen Klassifikationen von Entscheidungssituationen bzw. von entscheidungs- 
theoretischen Modellen führen. Die wichtigsten Unterscheidungen seien im 
folgenden genannt: 

• Entscheidender kann ein Individuum ( individuelle Entscheidungen ) oder 
eine Gruppe von Personen ( kollektive Entscheidungen) sein. Im Falle kol- 
lektiver Entscheidungen ist zu unterscheiden, ob die Personen der Gruppe 
unterschiedliche oder identische Zielvorstellungen besitzen. Im ersten 
Falle steht im Vordergrund der entscheidungstheoretischen Analyse die 
Frage nach der Aggregation der unterschiedlichen Präferenzen zu einer 
kollektiven Präferenz (vgl. die umfangreiche Literatur zu „Social Choice“- 
Problemen; insbesondere den Problemkreis „Arrow ’s Unmöglichkeitstheo- 
rem“); im zweiten Falle stehen Fragen nach der effizienten Kooperation 
der Gruppenmitglieder im Mittelpunkt des Interesses (vgl. Arbeiten zur 
Organisationstheorie, insbesondere die Theorie der Teams). 

• Bezüglich der durch den Entscheidenden nicht beeinflußbaren Faktoren 
des Entscheidungsproblems, der Umweltzustände also, läßt sich folgende 
Unterscheidung treffen: 

- Steht der Entscheidende einem oder mehreren „Gegenspielern“ ge- 
genüber, hängt das Eintreten eines Umweltzustandes also von der 
rationalen Wahl konkurrierender Entscheidungssubjekte ab, spricht 
man von einer Konkurrenzsituation. Entscheidungstheoretische Mo- 
delle dieser Art werden im Rahmen der Spieltheorie betrachtet. 

— Bei entscheidungstheoretischen Modellen im engeren Sinne — und um 
diese geht es hier — steht dem Entscheidenden der fiktive Gegenspie- 
ler „Natur“ gegenüber, der nicht rational kalkuliert. Hinsichtlich des 
Informationsstandes über das Eintreten der verschiedenen Umwelt- 
zustände lassen sich hierbei die folgenden Modelle unterscheiden: 

* Entscheidungen unter Sicherheit : Der Handelnde glaubt genau 
zu wissen, welcher Umweltzustand eintritt, und kann somit die 
Konsequenzen seiner Handlungen genau bestimmen. Für das Ent- 
scheidungsmodell heißt dies, daß die Menge Z einelementig ist und 
das Entscheidungsproblem sich auf die Festlegung der Nutzenwerte 
und das Auffinden eines geeigneten und praktischen Lösungsalgo- 
rithmus zur Bestimmung der optimalen Handlung „reduziert“. Das 
Simplexverfahren für lineare Optimierungsprobleme ist ein Beispiel 
für einen solchen Algorithmus. 
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* Entscheidungen unter Risiko : Der Entscheidende (Aktor) kann den 
einzelnen Umweltzuständen objektive oder subjektive Wahrschein- 
lichkeiten zuordnen, d.h. er definiert eine Wahrscheinlichkeitsver- 
teilung über die Menge Z. Zur Anwendung der Entscheidungsre- 
gel muß dann entweder die exakte Verteilung (A-priori-Verteilung) 
bekannt sein oder zumindest einzelne Parameter der Verteilung. 
Zusätzlich zu den oben beschriebenen Elementen eines entschei- 
dungstheoretischen Grundmodells tritt in diesem Falle die Kennt- 
nis der A-priori-Verteilung oder ihrer Parameter. 

* Entscheidungen unter Ungewißheit : Der Handelnde hat keinerlei 
Informationen über das Eintreten des einen oder anderen Umwelt- 
zustandes. 

- Schließlich sei noch erwähnt, daß eine Reihe neuerer Arbeiten von 
vagen, mehr oder weniger unpräzisen subjektiven Vorstellungen und 
Erfahrungen über das Eintreten einzelner Umweltzustände beim Ent- 
scheidenden ausgehen, deren Einbeziehung in entscheidungstheoreti- 
sche Modelle mittels wahrscheinlichkeitstheoretischer Methoden nicht 
möglich ist ( Entscheidungen bei unscharfer Problembeschreibung ). 

# Das vorgestellte entscheidungstheoretische Grundmodell bezieht sich auf 
einen sogenannten einstufigen Entscheidungsprozeß. Sind mehrere Ent- 
scheidungen in zeitlicher Folge erforderlich, die sich auch jeweils beein- 
flussen können, spricht man von einem mehrstufigen Entscheidungsprozeß 
(entsprechend von einem mehrstufigen oder sequentiellen Entscheidungs- 
modell). Steht der in der historischen Zeit ablaufende Entscheidungs- 
prozeß im Blickpunkt des Interesses, spricht man auch von dynamischen 
Entscheidungsmodellen im Gegensatz zu statischen Modellen. Dynami- 
sche Modelle haben insbesondere die im Zeitablauf vorhandene Varia- 
bilität des Informationsstandes des Entscheidenden zu berücksichtigen. 
Zur Beschreibung des Entscheidungsprozesses eignen sich deshalb Ent- 
scheidungsbäume besser als die oben beschriebenen Matrizen (vgl. Raiffa 
( 1973 )). 

• Schließlich sei noch die Unterscheidung deskriptive versus normative Ent- 
scheidungstheorie erwähnt. Während man sich im Rahmen der deskrip- 
tiven Entscheidungstheorie mit der Analyse und Beschreibung konkre- 
ter Entscheidungsprozesse auf der Grundlage empirischer Beobachtun- 
gen beschäftigt, geht es im Rahmen der normativen Entscheidungstheo- 
rie darum, wie ein rational Handelnder in einer Entscheidungssituation 
handeln sollte (in diesem Zusammenhang spricht man auch von Entschei- 
dungslogik oder Entscheidungskalkül) und nicht zuletzt um die Frage, was 
„rationales Handeln“ eigentlich sei. Eine exakte Grenzlinie zwischen de- 
skriptiver und normativer Entscheidungstheorie läßt sich unserer Meinung 
nach jedoch nicht angeben: Zum einen wird die normative Entscheidungs- 
theorie auf empirische Beobachtungen immer wieder zurückgreifen und 
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diese verarbeiten müssen, zum anderen sind empirische Beobachtungen 
ohne Bezug zu theoretischen Überlegungen bzw. ohne Rückgriff auf ein 
durch ein Modell geliefertes Raster (und für die Analyse von Entschei- 
dungssituationen leistet dies die normative Entscheidungstheorie) nicht 
sinnvoll („measurement without theory“). 

Ein weiterer wichtiger Punkt in diesem Zusammenhang ist der folgende: 
Begünstigt die Umgebung eines Aktors rationales Verhalten im Sinne der 
Entscheidungstheorie, so können normative Modelle zur Analyse kon- 
kreter Entscheidungsprozesse, die in einer solchen Umgebung ablaufen, 
sehr wohl herangezogen werden. Die komplexen Zusammenhänge und 
Abhängigkeiten in einer derartigen realen Entscheidungssituation werden 
dann vom normativen Modell in ihren grundlegenden Zügen und quali- 
tativen Strukturen richtig wiedergegeben. Für ein vertieftes Verständ- 
nis konkreter Entscheidungsprozesse in einer so strukturierten Umwelt 
können normative Modelle oft mehr beitragen als umfangreiche empiri- 
sche Erhebungen. 



Aufgabe 5.1/1 Buchhändler Unruhig, der sehr sorgfältig kalkulieren muß, 
überlegt, ob er von dem relativ unbekannten Statistikbuch „Die Statistik 
und die wichtigsten Fragen der Menschheit“ kein, ein oder zwei Exemplare 
in sein Sortiment aufnehmen soll. Das Buch wird ihm vom Verlag für DM 
40,- angeboten, und er hat pro verkauftes Buch einen Gewinn von DM 6,- 
errechnet. Über die Absatzchancen (ob er also kein Buch, ein oder sogar zwei 
Bücher verkaufen könnte) hat er allerdings keine Vorstellungen. 

a) Stellen Sie das beschriebene Entscheidungsproblem möglichst übersicht- 
lich in einer Tabelle dar. 

b) Wie lassen sich in diesem Falle den Konsequenzen Nutzenwerte zuordnen? 

c) Gehen Sie die verschiedenen Kriterien zur Klassifikation von Entschei- 
dungssituationen durch und prüfen Sie jeweils, zu welcher Kategorie unser 
Beispiel zu rechnen ist. 



Aufgabe 5.1/2 Zwei Männer werden wegen einer Straftat verhaftet. Die 
Polizei ist von der Schuld beider überzeugt, hat aber nicht genügend Beweise, 
um die beiden zu überführen. Die Polizei stellt beide getrennt — ohne daß 
diese sich miteinander absprechen können — vor folgende Situation: Wenn 
beide gestehen, muß jeder eine Strafe in Höhe von DM 1000,- bezahlen. Ge- 
steht nur einer von beiden die gemeinsame Tat, so erhält dieser eine Strafe in 
Höhe von DM 100,-, der nicht Geständige jedoch in Höhe von DM 10000,-. 
Gestehen beide nicht, dann werden beide wegen eines geringfügigeren, be- 
weisbaren Delikts zu einer Strafe von DM 600,- verurteilt. 

a) Stellen Sie das beschriebene Entscheidungsproblem übersichtlich dar. 




163 



b) Erklären Sie, wieso die Polizei überzeugt ist, daß beide gestehen werden, 
obwohl es doch für beide besser wäre, gemeinsam zu schweigen. 

c) Wie läßt sich das beschriebene Beispiel in unserer Klassifikation der Ent- 
scheidungssituationen einordnen? 

d) Hat die beschriebene Entscheidungssituation über das vorliegende Bei- 
spiel hinaus Bedeutung für konkrete Entscheidungsprobleme? 



Aufgabe 5.1/3 Herr Neureich möchte DM 10000,- für ein Jahr möglichst 

gewinnbringend anlegen. Von seinem Finanzberater hat er folgende Vor- 
schläge erhalten: 

1. Anlage auf einem Sparkonto mit vereinbarter einjähriger Kündigungsfrist; 
10% Verzinsung. 

2. Kauf einer Aktie, wobei die Verzinsung wie folgt aussieht : 

bei schlechter Konjunkturentwicklung -1% 
bei normaler Konjunkturentwicklung 10% 
bei guter Konjunkturentwicklung 20%. 

3. Kauf eines Anteils an einem Immobilienfond, wobei die Rendite bei den 
oben erwähnten unterschiedlichen Konjunkturentwicklungen jeweils 8%, 
9% bzw. 15% beträgt. 

a) Stellen Sie die Entscheidungssituation übersichtlich mit Hilfe der Nutzen- 
matrix dar. 

b) Welche Alternative könnte der Finanzberater von vornherein ausschlie- 
ßen, wenn er von Herrn Neureich wüßte: 

bl) daß Herr Neureich keine Aktion wählt, die möglicherweise mit einem 
Verlust verbunden ist; 

b2) daß Herr Neureich keine Aktion wählt, die in Zeiten guter Konjunk- 
turentwicklung weniger als DM 1500,- Gewinn bringt; 

b3) daß Herr Neureich Pessimist ist und von einer schlechten Konjunktur- 
entwicklung vollkommen überzeugt ist; 

b4) daß Herr Neureich eine schlechte Konjunkturentwicklung vollständig 
ausschließt. 

Ergänzungen und Bemerkungen 

• Sollen Handlungssequenzen innerhalb einer komplexen Entscheidungssi- 
tuation sichtbar werden, das Prozeßhafte einer Entscheidungswahl deut- 
lich werden oder der unterschiedliche Informationsstand der in einem Ent- 
scheidungsprozeß Befindlichen (z.B. im Rahmen spieltheoretischer Mo- 
delle) aufgezeigt werden, so bietet sich die Darstellung des Entscheidungs- 
prozesses durch einen Entscheidungsbaum an. Jede Baumdarstellung (in 
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der Spieltheorie spricht man von „Spiel in extensiver Form“) läßt sich auf 
eine Matrizendarstellung — wie wir sie eingeführt haben — reduzieren 
(Spieltheorie: „Spiel in Normalform“). Dabei geht in der Regel Informa- 
tion verloren. 

• Auf die Probleme der Nutzenmessung (Ableitung der Nutzenwerte aus 
Präferenzordnungen, Nutzenaxiomatik, Nutzenskala, spezielle Nutzen- 
funktionen usw.) sowie der Ermittlung der Wahrscheinlichkeitsverteilung 
und Zusammenhänge zwischen diesen beiden Problemen können wir hier 
nicht eingehen. Der interessierte Leser sei verwiesen auf den Klassiker 
Luce/Raiffa (1957) und die dort angeführte Literatur sowie auf Bühl- 
mann/ Loeffel/ Nie vergelt (1975) oder French (1986). 

• Aus Übersichtlichkeitsgründen werden wir uns auf den Fall endlicher Men- 
gen Z und A beschränken. Im Falle beliebiger Mengen sind Nutzen- 
werte durch entsprechend definierte Nutzenfunktionen, Wahrscheinlich- 
keiten bei überabzählbaren Mengen durch entsprechend definierte Dichten 
einzuführen. Auch werden wir in der Folge kardinalskalierte Nutzenwerte 
voraussetzen. 

• Schließlich sei noch darauf hingewiesen, daß man Entscheidungen unter 
Risiko und Entscheidungen unter Ungewißheit oft als Entscheidungen un- 
ter Unsicherheit zusammenfaßt. Ganz einheitlich ist die Terminologie in 
der entscheidungstheoretischen Literatur allerdings nicht. 



5.2 Statistische Entscheidungstheorie 

Ausgangspunkt unserer Problemstellungen im Rahmen der induktiven Stati- 
stik war eine vorliegende Stichprobe vom Umfang n, d.h. eine Stichproben- 
realisation x = (a?i, . . . , x n ). Aufgrund dieser Stichprobe wollten wir Auf- 
schluß gewinnen über die Verteilung der Grundgesamtheit bzw. über deren 
(unbekannte) Parameter. Am Beispiel der Testtheorie soll nun die entschei- 
dungstheoretisch orientierte Sichtweise der induktiven Statistik verdeutlicht 
werden. 

Wir setzen voraus, daß der Parameterraum 0 der möglichen Parame- 
terwerte nur aus den zwei Werten i?i und i ?2 besteht und das zu testende 
Hypothesenpaar wie folgt lautet: 

Ho : 'd = i?i, H\ : d = (Alternativentest). 

Dem Statistiker stehen zwei (Letzt)-Entscheidungen (Aktionen) zur Verfü- 
gung: 

d\\ Ho wird nicht verworfen 
c? 2 : Ho wird verworfen. 
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In der im vorigen Kapitel entwickelten entscheidungstheoretischen Sprache 
entspricht 0 = {^ 1 ,^ 2 } dem Zustandsraum Z, der sogenannte Entschei- 
dungsraum D = {^ 1 ,^ 2 } wurde dort als Aktionenraum A bezeichnet. Noch 
eine weitere Änderung gegenüber allgemeinen entscheidungstheoretischen 
Modellen ist in der statistischen Entscheidungstheorie üblich: Statt der Nut- 
zenfunktion U wird eine auf dem Konsequenzenraum definierte Schadens- 
funktion L betrachtet: 

L(dj,di) = Lij mißt den Schaden, der entsteht, wenn der Aktor die 
Aktion di wählt und dj der wahre Umweltzustand ist. Das Entscheidungs- 
problem des Statistikers wird dann durch folgende Matrix veranschaulicht: 







d 2 


di 


Ln 


L \2 


C?2 


L21 


L22 



Dabei drückt L 21 hier die Bewertung der Konsequenzen des Fehlers 1. Art 
und L 12 die des Fehlers 2. Art aus. 

Betrachtet man ein einstufiges induktives Verfahren mit vorgegebenem 
Stichprobenumfang n, d.h. aufgrund einer einfachen Stichprobe vom Umfang 
n und der daraus gewonnenen Information muß der Statistiker sich für eine 
der Letztentscheidungen d\ oder entscheiden, so läßt sich jedes statistische 
Verfahren (in unserem Beispiel: jeder Test) als eine sogenannte statistische 
Entscheidungsfunktion (Strategie) auffassen: 

6 : X — ► D. 

Dabei bezeichnen wir mit X den Raum aller möglichen Stichprobenrealisa- 
tionen x = (a?i, . ..,#„), und 6 ordnet jeder Stichprobenrealisation x eine 
Entscheidung d, £ D zu. Der Wert von <$(x), die zu wählende Entscheidung 
also, hängt von den in der Stichprobe zufällig ausgewählten statistischen Ein- 
heiten ab. 6 ist also eine Zufallsvariable. 

Bezeichnet man die x zugeordnete Zufallsvariable mit X, kann man zur 
Verdeutlichung <5(X) für 6 schreiben. Dabei betrachtet man in der Regel 
anstelle der n-dimensionalen Zufallsvariablen X = (X\, . . .,X n ) eine eindi- 
mensionale Zufallsvariable T(X), die die gesamte Information der Stichprobe 
zusammenfaßt (eine suffiziente Statistik T(X)). 

Zur Beurteilung des statistischen Verfahrens 6 liegt es nun nahe, den 
bei der Anwendung von 6 zu erwartenden Schaden durch Fehlentscheidungen 
zu berechnen. Dies führt zum Begriff der Risikofunktion r(d,6). Betrachtet 
man nur Stichproben vom festen Umfang n (und sind D sowie 0 endliche 
Mengen), dann ergibt sich als Risiko für ein statistisches Verfahren 6 bei 
Vorliegen eines Umweltzustandes dj £ 0: 

r{d h 6) = E[L(d h 6{X ))] = £ L(d } ,S(x)) W(x\^), 
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falls X eine diskrete Zufallsvariable ist. Dabei wird die Kenntnis der durch 
dj festgelegten Verteilung W(X\dj) auf X vorausgesetzt. Ist X stetig, so ist 
die Summation durch Integration und die Wahrscheinlichkeitsfunktion durch 
die entsprechende Dichtefunktion zu ersetzen. 

Setzt man im Beispiel Ln = L22 = 0 und wählt man für 6 das in Kapitel 
3 beschriebene Verfahren des Signifikanztests, so erhält man als Werte für die 
Risikofunktion: 



r($i,< 5 ) = (1 — a) • 0 + 0^21 = 0^21 
r(i> 2 ,«) = ßL \2 + (1 — /?) • 0 = ßL \2 

Werden vom Statistiker endlich viele statistische Verfahren , . . . , 6 m sowie 
endlich viele Parameterwerte $i, . . . , in Betracht gezogen, dann lassen sich 
für jedes Verfahren 6{ und jeden Umweltzustand (Parameterwert) auf die 
gerade beschriebene Weise Risikowerte r(tf ; -,<5j) berechnen. Die Auswahl ei- 
ner Entscheidungsfunktion aus der Klasse A = {£ 1 , . . . , 6 m } der betrachteten 
Strategien läßt sich durch das folgende Entscheidungsmodell darstellen: 





Ol 


0* 


«1 


r(t?i,<5i) .. 




bm 




r(d k ,6 m ) 



Man sagt, eine Strategie <5 € A dominiert bzw. ist gleichmäßig besser als eine 
andere Strategie 6' € A, wenn 

r($, < r($, &') für alle d G 0 und 

r(d, 6) < r(^, <5') für mindestens ein ^ E 0. 

Eine Strategie 6* £ A heißt gleichmäßig bestes Verfahren , wenn sie alle ande- 
ren zur Verfügung stehenden Strategien dominiert. Existiert ein gleichmäßig 
bestes Verfahren, so wird der Statistiker dieses wählen. In der Regel liefert 
die Risikofunktion jedoch keine vollständige Ordnung: viele Verfahren sind 
nach diesem Kriterium unvergleichbar, weil je nach Zustand d das eine oder 
das andere Verfahren kleinere Risikowerte aufweist. Lediglich dominierte 
Verfahren lassen sich durch dieses Kriterium aus dem Entscheidungsproblem 
ausschließen. Für die endgültige Wahl einer Entscheidungsfunktion sind also 
zusätzliche Kriterien notwendig, die wir in den nächsten beiden Abschnitten 
diskutieren wollen (Entscheidungskriterien) - wenn man nicht die ursprüng- 
lich betrachtete Klasse A von Entscheidungsfunktionen so weit einschränken 
will, daß ein gleichmäßig bestes Verfahren in der reduzierten Klasse existiert. 

Zunächst sollen jedoch noch einmal die wesentlichen Elemente statisti- 
scher Entscheidungsmodelle zusammengefaßt werden. Das Problem der Wahl 
der Letztentscheidung läßt sich beschreiben durch: 
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• den Parameterraum 0 = der dem Zustandsraum Z ent- 

spricht, 

• den Entscheidungsraum D = {d \, . . . , d s }, der dem Aktionenraum A ent- 
spricht, 

• die Schadensfunktion L, die die Nutzenfunktion U ersetzt. 

Das Problem der Auswahl eines statistischen Verfahrens definiert ein weiteres 
Entscheidungsproblem, gekennzeichnet durch: 

• den Parameterraum 0 = {$i, . . . , $*} (Zustandsraum), 

• die Klasse A = {<$i, . . . , 6 m }, der zur Diskussion stehenden statistischen 
Entscheidungsfunktionen <5 : X — ► D (Aktionenraum), 

• die Risikofunktion r(i? J -,6 l ) als Bewertungsfunktion. 



Aufgabe 5.2/1 

a) Erläutern Sie die Begriffe: statistische Entscheidungsfunktion, Risiko- 
funktion, gleichmäßig bestes statistisches Verfahren. 

b) Erläutern Sie folgende Aussage: „Mit Hilfe der Risikofunktion läßt sich 
das Problem des Statistikers, ein geeignetes statistisches Verfahren zu 
wählen, auf ein klassisches Entscheidungsproblem reduzieren“. 



Aufgabe 5.2/2 Der Ausschußanteil 7r einer Sendung Schrauben sei unbe- 
kannt. Es kommen aber nur ttq = 0.1 oder 7Ti = 0.25 als mögliche Werte für 

7r in Frage. 

a) Formulieren Sie die Hypothesen für einen Alternativentest. 

b) Welches sind die in Betracht zu ziehenden Letztentscheidungen des Sta- 
tistikers? 

c) Erstellen Sie mit Hilfe folgender Verlustfunktion die das Entscheidungs- 
problem charakterisierende Matrix: 

^(Fehler 1. Art)=10 

L(Fehler 2. Art)=l 

L(richtige Entscheidung)=0. 

d) Welche statistischen Verfahren (statistische Entscheidungsfunktionen) 
sind zu betrachten, wenn wir uns auf Signifikanztests und einfache Stich- 
proben vom Umfang n= 3 beschränken wollen? 

e) Berechnen Sie die Werte der Risikofunktion für die Verfahren aus d). Exi- 
stiert ein gleichmäßig bestes Verfahren? Existieren dominierte Verfahren? 
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f) Welche a- bzw. ß - Werte gehören zu den einzelnen Testverfahren? 

Ergänzungen und Bemerkungen 

• Die wichtigsten Grundlagen der statistischen Entscheidungstheorie wur- 
den von A. Wald (1902 - 1950) entwickelt. 

• Im Falle eines unendlichen Parameterraums läßt sich ein gleichmäßig be- 
stes Verfahren, falls es existiert, durch den Vergleich der Graphen der 
entsprechenden Risikofunktionen ermitteln. 

• Zur Betrachtung suffizienter Statistiken im Rahmen der statistischen Ent- 
scheidungstheorie vgl. Helten (1971). 

• Das hier vorgestellte Grundmodell der statistischen Entscheidungstheorie 
läßt sich in mehrfacher Hinsicht verallgemeinern: variable Stichproben- 
umfänge, mehrstufige Entscheidungs verfahren, randomisierte Verfahren 
sind nur einige Konzepte, die sich in statistischen Entscheidungsmodellen 
berücksichtigen lassen (vgl. hierzu Bamberg (1972)). 



5.3 Entscheidungen unter Risiko 

Gemäß der Klassifikation in Abschnitt 5.1.2 betrachten wir hier Entschei- 
dungssituationen, bei denen der Entscheidende in der Lage ist, eine Wahr- 
scheinlichkeitsverteilung über dem Zustandsraum Z anzugeben. Im endli- 
chen Fall bedeutet dies, daß der Entscheidende jedem Umweltzustand Zj 
(j = l,...,fc) eine Wahrscheinlichkeit pj ( j = 1 ,...,&) zuordnen kann. 
Natürlich muß 0 < p j < 1 und Ylj=iPj = 1 gehen. 

Unter den gemachten Voraussetzungen läßt sich dann jeder Aktion a, 
(i = 1, . . . , m) der Erwartungswert 

k 

E(a,i) = Pj Uij 

j = i 

zuordnen. Das Bernoulli- Prinzip besagt dann: Wähle eine Aktion a* = a,, 
für die 2?(a,*) maximal ist, d.h. 

a* = a t , falls ü?(a,-) > i?(a t / ) für alle i f ^ i. 

Wir betrachten nun die in Abschnitt 5.2 eingeführte Problemstellung der 
statistischen Entscheidungstheorie, die durch folgende Matrix gekennzeichnet 
ist: 





«?! 




Si 




■■ r(tf k , 6 1 ) 


öm 


**(^1 > ^m) 
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6i bezeichnet dabei jeweils relevante Entscheidungsfunktionen, dj mögliche 
Parameterwerte und r(dj , 6 t ) das Risiko der jeweiligen Entscheidungsfunktion 
bei gegebenem dj . Liegt nun eine diskrete Wahrscheinlichkeitsverteilung ( A- 
priori-Verteilung) <p{d) vor, so läßt sich das sogenannte Bayes-Risiko 



k 

r(ip, 6i) = E[<p(r(ti, <5,))] = 6 t ) 

j = i 

für jede Entscheidungsfunktion berechnen. Das zum Bernoulli-Prinzip ana- 
loge Kriterium zur Auswahl einer Entscheidungsfunktion lautet dann (hier 
handelt es sich um Verlustwerte): 

Wähle eine Entscheidungsfunktion 6* = 6, , für die r(<p, 6,*) minimal ist: 

6* = 6,-, falls r(<£>,<5j) < r(<^,(5 t /) für alle i' ^ i. 



Für eine vorliegende Stichprobe x = (a?i, . . . , x n ) vom Umfang n erhält man 
dann durch <5*(x) = d* £ D die optimale Letztentscheidung, die sogenannte 
Bayes-Lösung. 6* heißt Bay es- Verfahren. Es ist dadurch gekennzeichnet, 
daß sowohl die Vorinformation in Form der A-priori-Verteilung als auch die 
Stichprobeninformation für die Entscheidung genutzt werden. 

Dies wird noch deutlicher, wenn man das folgende Verfahren betrach- 
tet, das — ausgehend von der Stichprobeninformation und der A-priori- 
Verteilung — direkt zur Bayes-Lösung führt: 

• Man berechnet die zur A-priori-Verteilung <p(d) und der Stichprobenrea- 
lisation x = (#i, . . . , x n ) gehörende A-posteriori-Verteilung mit Hilfe der 
Formel von Bayes: 



/ ip( , d\x) 



W{x\d)(p{ , d) 

ZUi w ( x \*M*iY 



ee. 



(Revision der A-priori-Verteilung aufgrund der Stichprobeninformation). 



• Für jede Letztentscheidung di bestimmt man den sogenannten A-poste- 
riori-Erwartungswert : 

k 

= I*)- 

j = l 



• Die Aktion d* = di , die einen minimalen A-posteriori-Erwartungswert 
aufweist, ist eine Bayes-Lösung. 

Diese zweite Methode ( konstruktive Methode) hat unter anderem den Vorteil, 
daß von den zwei in Abschnitt 5.2 eingeführten Entscheidungsmodellen nur 
das erste (Auswahl der Letztentscheidung) betrachtet werden muß. Es muß 
allerdings im Unterschied zur ersten Methode ( integrale Methode) für jede 
neue Stichprobenrealisation neu durchgeführt werden. 




170 



Aufgabe 5.3/1 

a) Ihnen wird folgendes Spiel angeboten: Eine faire Münze wird geworfen. 
Fällt beim ersten Wurf Wappen, erhalten Sie 2 DM; fällt erst beim zweiten 
Wurf Wappen, erhalten Sie 2 2 = 4 DM usw.; d.h. fällt (z-l)-mal Zahl und 
dann erst Wappen, so erhalten Sie 2 Z DM. Welchen Einsatz wären Sie 
bereit zu zahlen, um an diesem Spiel teilzunehmen? 

b) Inwieweit ist die in a) beschriebene Entscheidungssituation eine Begrün- 
dung dafür, das Bernoulli-Prinzip (definiert für Nutzenwerte) statt des so- 
genannten /i-Kriteriums (definiert analog zum Bernoulli-Kriterium, aber 
für Geldgrößen) als Entscheidungsregel für Entscheidungen unter Risiko 
vorzuschlagen? 

c) Welches Skalenniveau der Nutzenwerte setzt die Anwendung des Bernoul- 
li-Prinzips voraus? 



Aufgabe 5.3/2 Aufgrund langfristiger Wetterbeobachtungen sei bekannt, 
daß die Wahrscheinlichkeit für Schneefall an den Weihnachtstagen 0.1 be- 
trage. Die Wahrscheinlichkeit, daß die Wetterprognose des Wetteramtes das 
Wetter an den Weihnachtstagen richtig voraussagt, sei 0.8. 

a) Geben Sie die möglichen Umweltzustände und die zugehörige A-priori- 
Verteilung an. 

b) Bestimmen Sie die A-posteriori- Verteilung, wenn der Wetterbericht für 
Weihnachten Schneefall voraussagt. 



Aufgabe 5.3/3 Eine Entscheidungssituation sei durch folgende Nutzenma- 
trix beschrieben: 

/ 3 5 0 \ 

0 0 8 

V? i ij 

Welche Aktion ist nach dem Bernoulli-Prinzip zu wählen bei einer die Wahr- 
scheinlichkeitsverteilung über dem Zustandsraum Z von 

a) (1/3, 1/3, 1/3), 

b) (1/4, 3/4, 0), 

c) (0, 1/10, 9/10)? 



Aufgabe 5.3/4 

a) Welches ist die optimale Aktion, wenn Buchhändler Unruhig in Aufgabe 
5.1/1 mit der Wahrscheinlichkeit 1/10 rechnet, kein Buch, mit der Wahr- 
scheinlichkeit 6/10, ein Buch, und mit 3/10, zwei Bücher zu verkaufen? 
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b) Welche Geldanlagemöglichkeit sollte Herr Neureich wählen (Aufgabe 
5.1/3), wenn ein zuverlässiges Konjunkturinstitut die Wahrscheinlichkei- 
ten für die Konjunkturentwicklung wie folgt beurteilt: 

W(gut) = 0.3, W (normal) = 0.3, W(schlecht) = 0.4? 

c) Welcher Test ist in Aufgabe 5.2/2 zu wählen, wenn die A-priori- Wahr- 
scheinlichkeit für 7r = 7 Tq 0.6 beträgt? 



Ergänzungen und Bemerkungen 

• Die Äquivalenz der beiden Verfahren, die zur Bestimmung der Bayes- 
Lösung führen, wird u. a. bei Bühlmann/Loeffel/Nie vergelt (1975), Ka- 
pitel 15, gezeigt. 

• Weitere Entscheidungskriterien bei Risiko finden sich bei Schneeweiß 
(1967). 

• Ebenfalls bei Schneeweiß (1967) findet sich eine axiomatische Charak- 
terisierung des Bernoulli-Prinzips auf der Grundlage von vier Axiomen, 
die als plausible Annahme für rationales Verhalten in Risikosituationen 
interpretiert werden können. 

• Zusammenhänge zwischen der Form der A-priori-Verteilung <£>($), der 
Form der Likelihoodfunktion W{x\d) sowie der A-posteriori- Verteilung 
x/){d\x) sind intensiv untersucht worden. So interessiert man sich für 
Verteilungsklassen, denen bei gegebener Likelihoodfunktion sowohl die 
A-priori-Verteilung als auch die A-posteriori- Verteilung angehören („kon- 
jugierte Verteilungen“). Vgl. hierzu die Ausführungen von Helten (1971). 

• In einer Reihe von Büchern stehen statistische Methoden auf der Grund- 
lage der Bayes-Methode im Vordergrund des Interesses, oder es werden 
sogar ausschließlich Bayes-Methoden diskutiert. Vgl. Raiffa/ Schlaifer 
(1961), Box/Tiao (1973), Göttinger (1980), Kleiter (1981). 

5.4 Entscheidungen unter Ungewißheit 

Wir gehen wieder von dem entscheidungstheoretischen Grundmodell mit 
kardinalskalierten Nutzenwerten aus, wie es in Abschnitt 5.1.1 beschrieben 
wurde. Gemäß Abschnitt 5.2 setzen wir auch voraus, daß dominierte Ak- 
tionen bereits aus der Betrachtung ausgeschlossen worden sind und keine 
gleichmäßig beste Aktion unter den Aktionen aus A = {ai, . . . , a m } existiert. 
(Bei den Dominanzkriterien müssen natürlich bei einer Nutzenbewertung die 
Ungleichheitsrelationen gegenüber denen bei der Schadensbewertung umge- 
kehrt werden.) Liegen keine zusätzlichen Informationen über das Eintreten 
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eines der Umweltzustände aus Z vor, die sich zu einer Wahrscheinlichkeitsver- 
teilung über Z verdichten lassen, so kann das in 5.3 vorgeschlagene Bernoulli- 
Kriterium nicht angewandt werden. Anwendbare Entscheidungskriterien in 
dieser Situation sind die folgenden: 

• Laplace- Regel: Wenn keine Informationen über eine spezielle Wahrschein- 
lichkeitsverteilung über Z vorliegen, so ordne jedem möglichen Umwelt- 
zustand zj aus der fc-elementigen Menge Z die Wahrscheinlichkeit l/k 
zu (alle Um weit zustande sind dann gleichwahrscheinlich) und wende das 
aus 5.3 bekannte Bernoulli- oder Bayes-Kriterium auf diese spezielle Ent- 
scheidungssituation unter Risiko an. Da bei dem Nutzenerwartungswert 
alle Nutzenwerte jeweils die gleiche Wahrscheinlichkeit haben, läuft dies 
darauf hinaus, die Nutzensumme zu maximieren: 

k k 

a* = a r ^ U r j = max ^ Uij . 
j - i * j = i 

• Wald-Regel: Wähle eine Aktion a *, für die gilt, daß der mindestens er- 
reichbare Nutzenwert 

min Uij 
j 

maximal ist. Entsprechend der Auswahlregel 

a* — a r O min U r j — max min Uij 

j * 3 

nennt man diese Regel auch Maximin- Regel. Da in der statistischen Ent- 
scheidungstheorie statt Nutzenwerten Uij in der Regel Schadens werte 
(bzw. Risikowerte r) betrachtet werden, lautet die Regel hier 

a* = a r & max L r j = min max 

j * 3 

und heißt entsprechend Minimax-Regel. 

• Hurwicz- Regel: Wähle zunächst einen Parameter A mit 0 < A < 1. Be- 
stimme für jede Aktion a* sowohl den maximal als auch den minimal 
erreichbaren Nutzen 



Mi = max Uij , m, = min Uij . 

3 3 

Wähle eine Aktion a * , für die A Mi + (1 — A)m; maximal ist: 

a* = a r O A M r + (1 — A)m r = max(AM a - + (1 — A)m a ). 

i 

Im Schadensfall ist Uij durch Lij zu ersetzen und die Aktion zu wählen, 
für die Am, -f (1 — A)M a minimal ist. 
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• Savage-Niehans-Regel : Bestimme die Opportunitätskosten 

Oij — max U s j - Uij 



für jedes Element Uij der Nutzenmatrix. Man gelangt so von der Nutzen- 
matrix zu einer entsprechenden Opportunitätskostenmatrix, auf die man 
dann die Minimax-Regel anwendet: 

a* = a r <=> max 0 r j = min max Oij . 

3 * 3 

Im Falle einer Schadensmatrix ist Oij = Lij — min, L s j zu setzen. 



Aufgabe 5.4/1 

a) Welche Plausibilitätsgründe sprechen für die Anwendung der Laplace- 
Regel? Welche Plausibilitätsgründe können für die anderen Regeln ins 
Feld geführt werden? 

b) „Die Maximin-Regel hat ihre Bedeutung insbesondere für Konkurrenz- 
situationen, in denen sich zwei Spieler mit völlig entgegengesetzten In- 
teressen gegenüberstehen“. Diskutieren Sie diese Aussage, indem Sie die 
Anwendung der vier angeführten Regeln auf die beschriebene Situation 
prüfen. 

c) Welche der angeführten Regeln lassen sich auch sinnvoll auf ordinale Nut- 
zenwerte anwenden? 



Aufgabe 5.4/2 

a) Zu welchen optimalen Aktionen führen die verschiedenen Entscheidungs- 
regeln für die in Aufgabe 5.1/1 beschriebene Situation? (Wählen Sie für 
die Hurwicz- Regel A=0.5, A=0.9). 

b) Beantworten Sie die in a) gestellte Frage für das in Aufgabe 5.1/3 gestellte 
Entscheidungsproblem. 

c) Welche Einwände lassen sich gegen die Verwendung des Wald-Kriteriums 
für Entscheidungssituationen bei Unsicherheit, die nicht Konkurrenzsi- 
tuationen sind, Vorbringen? 



Aufgabe 5.4/3 Zu welchem Signifikanztest führt die Anwendung der Re- 
geln in Aufgabe 5.2/2 (Hurwicz mit A=0.1)? 
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Ergänzungen und Bemerkungen 

• Eine axiomatische Charakterisierung der hier vorgestellten Entschei- 
dungsregeln bei Ungewißheit findet sich bei Milnor (1954). Darüber hin- 
aus gibt Milnor in derselben Arbeit notwendige und hinreichende Bedin- 
gungen für die einzelnen Entscheidungsregeln an und zeigt, daß es keine 
Regel gibt, die zehn von ihm eingeführte Axiome — die man alle als „ra- 
tionale“ Forderungen an eine Auswahlregel unter Unsicherheit begreifen 
kann — gleichzeitig erfüllt (Inkonsistenzresultat). 

• Zur Interpretation und Diskussion der einzelnen Entscheidungsregeln 
vgl. Lehrbücher zur Entscheidungstheorie wie z.B. Bamberg/Coenenberg 
(1977), Ferschl (1975) oder Bühlmann/ Loeffel/ Nievergelt (1975), um nur 
einige deutschsprachige Lehrbücher zu nennen. 




Anhang A 

Zusätzliche 

Übungsaufgaben 



Aufgabe Z/1 Die Dichtefunktion einer stetigen Zufallsvariablen hat die 
Abbildung A.l dargestellte Form. 




Abbildung A.l: 

a) Bestimmen Sie den Term der Dichtefunktion. 

b) Bestimmen Sie E(X). 

c) Berechnen Sie W( 1 < X < 2.5). 

d) Bestimmen Sie a so, daß W{X > a) = 1/4. 
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Aufgabe Z/2 Auf einer Pressekonferenz anläßlich der Internationalen Messe 
für Damenoberbekleidung in Düsseldorf wurde bekannt, daß die Frauen und 
Mädchen in der BRD 1980 durchschnittlich 966 Mark für Oberbekleidung 
ausgaben. Eine Umfrage in der Düsseldorfer Altstadt bei 100 Düsseldorfe- 
rinnen ergab einen durchschnittlichen Betrag von 1000 DM (s„_i = 340). 

a) Geben Sie aufgrund der Stichprobe eine Punktschätzung für die durch- 
schnittlichen Ausgaben für Damenoberbekleidung der Düsseidorferinnen. 
Ist die ML-Methode anwendbar? 

b) Geben Sie aufgrund der Stichprobe eine Intervallschätzung mit a =0.05. 

c) Läßt sich aufgrund der Stichprobe die Behauptung, die Düsseldorferin sei 
modebewußter als die „Durchschnittsdeutsche“ und gebe deshalb signifi- 
kant mehr Geld für Oberbekleidung aus, bestätigen (a = 0.05)? 

d) Welche Bedeutung hat die Student-Verteilung für die Testtheorie? 



Aufgabe Z/3 Eine Untersuchung zur Einkommensverteilung unter Ange- 
stellten ergibt folgende Ergebnisse für die Monatsgehälter: 



< Xi < 


rii 


0-1500 


10 


1500-2500 


55 


2500-3500 


25 


3500-6500 


10 



a) Geben Sie eine Punktschätzung für das durchschnittliche Einkommen der 
Angestellten aufgrund der vorliegenden Untersuchung. 

b) Testen Sie, ob sich für die Einkommensverteilung der Angestellten eine 
Normalverteilung ^(2500,1000) unterstellen läßt (a=0.05). 

c) Überprüfen Sie die Hypothese, daß das Durchschnittseinkommen der An- 
gestellten 2500 DM beträgt (a = 0.05). 

d) Läßt sich eine Intervallschätzung für das Durchschnittseinkommen oder 
die Varianz angeben? Wenn ja, führen Sie diese durch (a 0.05). 



Aufgabe Z/4 Professor P. und sein Mitarbeiter T. suchen nach intensiven 
wissenschaftlichen Diskussionen gern Entspannung beim Tischfußballspiel. 
T. ist der Meinung, daß kein Unterschied in der Spielstärke zwischen ihm 
und Professor P. besteht (a = 0.05). 

a) Läßt sich die Hypothese des Herrn T. aufrechterhalten, wenn Professor P. 
sechs von zehn Spielen gewonnen hat? 

b) Nach 100 Spielen weist Professor P. 60 gewonnene Spiele auf. Kann jetzt 
noch von gleicher Spielstärke der beiden Kontrahenten gesprochen wer- 
den? 
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c) Begründen Sie das in a) bzw. b) gewählte statistische Verfahren. 

d) Welche Annahme muß unterstellt werden, wenn die Fragen a) und b) mit 
statistischen Verfahren beantwortet werden sollen? 



Aufgabe Z/5 Ein Unternehmen wendet bei der Wareneingangskontrolle 
für bestimmte Vorprodukte folgendes Verfahren an: Es werden aus jeder 
Lieferung 10 verschiedene Stücke entnommen und auf Funktionstüchtigkeit 
überprüft. Sind mindestens 6 Stücke in Ordnung, wird die Lieferung an- 
genommen. Sind weniger als fünf Stücke in Ordnung, wird die Lieferung 
zurückgewiesen. Im Falle von 5 unbrauchbaren Stücken in der Stichprobe 
wird eine zweite Stichprobe vom Umfang 5 gezogen. Die Lieferung wird 
dann endgültig zurückgewiesen, wenn in dieser zweiten Stichprobe mehr als 
ein unbrauchbares Stück ist; sonst wird sie angenommen. 

a) Berechnen Sie die Wahrscheinlichkeit dafür, daß eine Lieferung aus 1000 
Stücken zurückgewiesen wird, wenn diese tatsächlich 200 unbrauchbare 
Stücke enthält. 

b) Was versteht man unter „Stetigkeitskorrektur“? 

c) Welche Bedeutung hat die Poisson-Verteilung für die Statistik? 



Aufgabe Z/6 Nach einer Informationsschrift des Kultusministers des Lan- 
des NRW bleiben 6% aller Schüler einer Gesamtschule ohne Schulabschluß, 
26% erreichen Hauptschulabschluß, 68% Fachhochschulreife und 27% das Ab- 
itur. Für Schüler im traditionellen Schulsystem lauten die entsprechenden 
Zahlen: 9% ohne Abschluß, 39% Hauptschulabschluß, 50% Fachhochschul- 
reife und 18% Abitur. 

a) Läßt sich ein Test verfahren angeben, mit dessen Hilfe die Frage entschie- 
den werden kann, ob zwischen dem Schulabschluß eines Schülers und der 
gewählten Schulform ein Zusammenhang besteht? 

b) Die Untersuchung des Kultusministeriums ergab weiter, daß von 100 
Schülern in Gesamtschulen 20 Schüler eine der Klassen 5 bis 10 wieder- 
holten. In Gymnasien waren dies 40 Schüler von 100. Was läßt sich 
mit einer Aussagesicherheit von 95% über den Betrag der Differenz dieser 
Anteilswerte aussagen? 

c) Erläutern Sie das Begriffspaar: „statistische Signifikanz“ — „praktische 
Relevanz“. 



Aufgabe Z/7 Bei einer Befragung von 100 Personen im Rahmen einer Ge- 
sundheitsstudie äußerten sich 1979 ein Fünftel der Befragten positiv zur Ein- 
nahme von Beruhigungsmitteln. 




178 



a) Läßt sich die langjährige Beobachtung, daß 25% aller Bewohner der BRD 
Beruhigungsmittel positiv einschätzen, aufgrund der neuen Umfrage noch 
aufrechterhalten (a = 0.05)? 

b) Wie groß ist die Wahrscheinlichkeit, daß von 10 Personen sich weniger als 
3 Personen positiv zur Einnahme von Beruhigungsmitteln äußern, wenn 
der entsprechende Anteil an der Gesamtbevölkerung 25% beträgt? 

c) Inwiefern läßt sich das zur Beantwortung von b) herangezogene statisti- 
sche Verfahren als Testverfahren auffassen? 

d) Bei einem sogenannten Doppelblindversuch (100 Personen mit einem 
identischen Krankheitsbild erhalten ein Arzneimittel, 100 weitere Perso- 
nen mit demselben Krankheitsbefund erhalten ein Placebopräparat ohne 
Wirksubstanz; weder Arzt noch Patient weiß, wer das Placebo oder die 
Wirksubstanz erhält) ergab sich, daß bei 48 der mit dem Arzneimittel 
behandelten Personen meßbare Heilwirkungen feststellbar waren, der ent- 
sprechende Anteil bei den Placebo-Behandelten jedoch immerhin 45% be- 
trug. Ist diese Abweichung signifikant (a = 0.10)? 



Aufgabe Z/8 Aus einer normalverteilten Grundgesamtheit wird folgende 
Stichprobe gezogen: 



90, 100, 105, 80, 125. 

a) Geben Sie eine Punktschätzung für den Mittelwert der Grundgesamtheit. 
Erläutern Sie das von Ihnen gewählte Schätz verfahren. 

b) Welche Bedeutung hat die Effizienz für Schätzfunktionen? 

c) Geben Sie eine Intervallschätzung für p (a = 0.10). Erläutern Sie Ihr 
Vorgehen. 

d) Machen Sie den Unterschied zwischen einem Schätz- und einem Test ver- 
fahren stichwortartig deutlich. 



Aufgabe Z/9 Eine Entscheidungssituation sei durch folgende Nutzenma- 
trix beschrieben: 



1111 
0 2 3 0 
0 0 4 0 



a) Bestimmen Sie die jeweils optimale Aktion mit Hilfe der Laplace-, der 
Wald-, der Hurwicz- und der Savage-Nieh ans- Regel. (Wählen Sie A = 0.9 
für die Hurwicz-Regel.) 

b) Inwiefern legt das Resultat von a) es nahe, von einer „Subjektivität des 
Rationalitätsbegriffs“ zu sprechen? 
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c) Wodurch ist eine Entscheidungssituation unter Ungewißheit charakteri- 
siert? 



Aufgabe Z/10 Eine Unternehmung bezieht Elektronikteile zu 60% von Lie- 
ferant A und zu 40% von Lieferant B. Der Ausschußanteil beträgt bei Liefe- 
rant A erfahrungsgemäß 5%, bei Lieferant B 10%. Im Lager befindet sich ein 
Los von Elektronikteilen, dessen Herkunft unbekannt ist. Durch Entnahme 
und Funktionskontrolle eines Teils soll entschieden werden, ob das Los von 
Lieferant A bzw. B stammt. Eine richtige Entscheidung verursacht weder 
Schaden noch Nutzen. Entscheiden Sie fälschlicherweise auf A, so beträgt 
der Schaden 100 Einheiten, entscheiden Sie fälschlicherweise auf B, so beträgt 
der Schaden 80 Einheiten. 

Erstellen Sie die Schadensmatrix. Bestimmen Sie die A-priori-Wahrschein- 
lichkeiten, die möglichen Entscheidungsfunktionen und die optimale Bayes- 
sche Entscheidungsfunktion. Wie lautet Ihre Entscheidung, wenn das ent- 
nommene Teil defekt ist? 



Aufgabe Z/11 Die Zufallsvariable X hat eine Dichte, deren Form und Ver- 
lauf die folgende Darstellung angibt: 




a) Bestimmen Sie den Term der Dichtefunktion. 

b) Nennen Sie die Eigenschaften einer Dichtefunktion. 

c) Bestimmen Sie den Term der Verteilungsfunktion F(x). 

d) Wie lautet der Zentralwert dieser Zufallsvariablen? 

e) Durch welche Relation zwischen den Lageparametern ist diese Zufallsva- 
riable gekennzeichnet? 
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Aufgabe Z/12 Nach einer Studie der Medizinischen Hochschule Hannover 
dauert die ärztliche Visite im Krankenhaus durchschnittlich 3 Minuten. Beim 
Gespräch Patient-Arzt werden dabei 80% aller Fragen vom Arzt gestellt. 

a) In einem Krankenhaus wird eine durchschnittliche Dauer der Visite von 
4 Minuten festgestellt. Prüfen Sie, ob dieses Ergebnis signifikant von den 
Resultaten aus Hannover nach oben ab weicht, wenn s n _i = 1 gilt und in 
diesem Krankenhaus 400 Patienten beobachtet wurden (a=0.05). 

b) Im gleichen Krankenhaus wurde beobachtet, daß im Gespräch Arzt- 
Patient 25% aller Fragen vom Patient gestellt wurden. Ist dies eine signi- 
fikante Abweichung vom Ergebnis der Studie (a = 0.05)? 

c) Begründen Sie Ihre Wahl der Testverteilung in a) bzw. in b). 



Aufgabe Z/13 

a) Wie läßt sich die Wahrscheinlichkeitsverteilung einer Zufallsvariable be- 
schreiben? 

b) Nennen Sie die wesentlichen Unterscheidungsmerkmale zwischen diskre- 
ten und stetigen Zufallsvariablen. 

c) Unter der Voraussetzung, daß die Mädchen- und Knabengeburten in einer 
Familie gleichwahrscheinlich sind, sind folgende Wahrscheinlichkeiten zu 
berechnen: 

• daß eine Familie mit zwei Kindern mindestens einen Jungen hat, 

• daß eine Familie mit vier Kindern höchstens ein Mädchen hat, 

• daß eine Familie, die einen Jungen hat, als nächstes Kind ein Mädchen 
bekommt. 



Aufgabe Z/14 Eine Untersuchung bei 100 Krankenhäusern ergab, daß in 

40 Fällen wichtige Brandschutzmaßnahmen nicht eingehalten werden. 

a) Welche Aussage läßt sich mit 95.4%-iger Sicherheit über den Anteil der 
Krankenhäuser, die wichtige Brandschutzvorschriften unzureichend be- 
achten, insgesamt machen? 

b) Bestätigt die obige Stichprobe die Behauptung eines verantwortlichen Po- 
litikers, daß in mehr als der Hälfte aller Fälle alle wichtigen Brandschutz- 
maßnahmen korrekt eingehalten werden (a = 0.05)? 



Aufgabe Z/15 In Finnland gehörten 1977 90% der Lutheranischen Kirche 
an, 1% der Orthodoxen Kirche und 1% anderen Kirchen an. 8% aller Finnen 
gehörten keiner Konfession an. 
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a) Wie groß ist die Wahrscheinlichkeit, daß von 10 zufällig ausgewählten fin- 
nischen Bürgern genau 7 der Lutheranischen und je einer der Orthodoxen, 
anderen Kirchen und keiner Kirche angehört? 

b) Wie groß ist die Wahrscheinlichkeit, daß von 10 zufällig ausgewählten 
finnischen Bürgern genau 6 einer Kirche angehören? 

c) Wie groß ist die Wahrscheinlichkeit, daß von 100 zufällig ausgewählten 
finnischen Bürgern mehr als 20 Bürger der Lutheranischen Kirche an- 
gehören? 

d) Wie groß ist die Wahrscheinlichkeit, daß von 50 zufällig ausgewählten 
Finnen höchstens 10 keiner Konfession angehören? 



Aufgabe Z/16 

a) Nennen Sie Elemente eines entscheidungstheoretischen Grundmodells. 

b) Welche Bedeutung haben entscheidungstheoretische Modelle für den Sta- 
tistiker? 

c) Erläutern Sie folgende Begriffe: Schadensfunktion, statistische Entschei- 
dungsfunktion, Risikofunktion. 

d) Eine Entscheidungssituation sei durch folgende Matrix gekennzeichnet: 





0i 


02 


6 1 


0 


5 


62 


10 


0 



Bestimmen Sie das Bayes- Verfahren 6*, wenn <p(t?i) = 1/4 ist. 

e) ” Risiko einzugehen ist eine wunderbare Sache, aber man kann es nicht 
kalkulieren.” (Bundestrainer Derwall vor dem Fußballspiel gegen Brasilien, 
laut Süddeutscher Zeitung vom 19. 5. 1981.) 

Stimmt dieser Risikobegriff mit dem der Entscheidungstheorie überein? 



Aufgabe Z/17 

a) Was verstehen Sie unter einem Zufallsexperiment? Welcher Zusammen- 
hang besteht zwischen einem Zufallsexperiment und dem Begriff „Zufalls- 
variable“? 

b) Laut einer Pressenotiz gibt es in der Spielbank von Garmisch-Partenkir- 
chen jetzt einen Computer: „Er zeigt dem Roulette-Spieler die zuletzt 
gefallenen zwanzig Zahlen und die Permanenzen des Vortags“. Erhöhen 
sich dadurch die Gewinnchancen der Spieler? Spieler G. Winn setzt immer 
auf die Zahlen, die am Vortag und in den letzten zwanzig Spielen nicht fie- 
len („Da alle Zahlen gleichwahrscheinlich sind, müssen die ja kommen!“), 




182 



während Spieler V. Orsicht gerade auf die Zahlen setzt, die sehr oft am 
Vortag fielen („Das Roulette hat eine Präferenz für diese Zahlen“). Was 
meinen Sie dazu? 

c) Wie wahrscheinlich ist es beim Zahlenlotto 

• genau 6 Richtige 

• genau 3 Richtige 

• mindestens 3 Richtige 
zu haben? 

d) Kommentieren Sie die beiden folgenden Meldungen! Widersprechen sie 
wahrscheinlichkeitstheoretischen Axiomen oder Rechenregeln? 

dl) „In der Politik ist die Wahrscheinlichkeit die höchste Form der 
Gewißheit — was darüber hinausgeht, ist entweder schon Geschichte 
oder Scharlatanerie“ (J. Groß in Capital, 12, 1980). 

d2) Laut Meldung einer Nachrichtenagentur im Dezember 1980 kam ein 
Mann auf folgende tragische Art ums Leben: Er erlitt einen Herzanfall 
im Badezimmer und stürzte dabei so unglücklich in die Badewanne, 
daß er dabei die Seifenschale abriß. Diese legte sich vor den Abfluß. 
Der stark tropfende Hahn führte dann zu einem Ansteigen des Wassers 
in der Wanne und schließlich zum Tode des Mannes durch Ertrinken. 



Aufgabe Z/18 Zur Kalkulation der Prämien für Krankenhaustagegeldver- 
sicherungen untersucht eine Krankenversicherungsgesellschaft den Zusam- 
menhang zwischen Alter der Krankenhauspatienten (X, in Jahren) und Auf- 
enthaltsdauer im Krankenhaus (V, in Tagen). Eine erste Voruntersuchung 
zu diesem Zweck ergibt folgendes Ergebnis: 



Xi 


4 


10 


10 


20 


30 


30 


40 


50 


60 


70 


Vi 


4 


7 


10 


9 


10 


8 


12 


15 


20 


25 



a) Analysieren Sie die Abhängigkeit der Aufenthaltsdauer im Krankenhaus 
vom Alter des Patienten mit Hilfe eines linearen Regressionsmodells. 

b) Was versteht man unter zwei verbundenen Stichproben? 



Aufgabe Z/19 Bei Beobachtungen, die über einen längeren Zeitraum an 
einer vielbefahrenen Straße gemacht wurden, wurde festgestellt, daß jeder 
10. vorbeifahrende PKW ein japanisches Fabrikat war. 

a) Geben Sie eine Intervallschätzung für den Marktanteil japanischer PKW’s 
aufgrund der vorliegenden Beobachtungen, wenn insgesamt 10000 PKW’s 
auf dieser Schnellstraße während des Beobachtungszeitraums gezählt wur- 
den (q = 0.05). 
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b) Welches Ergebnis erhält man in a), wenn lediglich 100 PKW’s beobachtet 
wurden? 

c) Erläutern Sie anhand der Antworten zu a) und b) die Begriffe „Aussage- 
sicherheit“ und „Aussagegenauigkeit“. 



Aufgabe Z/20 Bezeichne X das Merkmal „Alter der eheschließenden Frau“ 
und Y das Merkmal „Alter des eheschließenden Mannes“. Folgende Wahr- 
scheinlichkeiten sind aufgrund längerer Beobachtungen abgeleitet worden: 





-19 20 - 39 40 - 59 60 - 


E 


- 19 


0.04 0.16 


0.20 


20-39 


0.60 0.09 


0.70 


40-59 


0.03 0.02 




60 - 


0.01 


0.01 


E 


0.05 0.80 



a) Erstellen Sie die gemeinsame Wahrscheinlichkeitsverteilung von X und Y 
sowie die jeweilige Randverteilung, indem Sie die oben angegebene Tabelle 
vervollständigen. Sind X ) Y unabhängig? 

b) Ordnen Sie den einzelnen Altersklassen jeweils die Zahlen 1 bis 4 zu und 
errechnen Sie dann E(X) sowie E(Y). Ist eine solche Vorgehensweise in 
konkreten empirischen Untersuchungen empfehlenswert? 

c) Erläutern Sie den Unterschied zwischen gemeinsamer Wahrscheinlich- 
keitsverteilung und bedingten Verteilungen anhand einiger Beispiele aus 
obiger Tabelle. 

d) Diskutieren Sie folgende Aussage: „Die gesamte Information über die 
gemeinsame Wahrscheinlichkeitsverteilung ist bereits in den Randvertei- 
lungen enthalten“. 



Aufgabe Z/21 Bei einer Untersuchung (Teilerhebung) wurde als durch- 
schnittliches Bruttomonatseinkommen für einen männlichen Arbeiter im 

Jahre 1972 1600,- DM ermittelt. Die Standardabweichung betrug 340,- DM 

a) Mit welcher Aussagesicherheit kann behauptet werden, daß der Durch- 
schnittslohn zwischen 1532,- DM und 1668,- DM lag, wenn bei der dama- 
ligen Untersuchung 100 männliche Arbeiter befragt wurden? 

b) Wie groß hätte der Stichprobenumfang n gewählt werden müssen, da- 
mit die Aussage in a) mit einer Sicherheit von 99.73% behauptet werden 
könnte, wenn <7=340 gilt? 

c) Wie läßt sich die Aussagegenauigkeit einer Intervallschätzung verbessern? 

d) Nennen und erläutern Sie eine Anwendung der x 2 "Verteilung in der 
Schätz theorie. 
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Aufgabe Z/22 Zur Überprüfung der Angaben des Herstellers zum Benzin- 
verbrauch eines seiner PKW-Typen („durchschnittlicher Benzinverbrauch im 
Stadtverkehr höchstens 10 l/100km“) testet eine Verbraucherorganisation 101 
PKW’s dieses Typs. 

a) Die Verbraucherorganisation will die Angaben des Herstellers zurückwei- 
sen, wenn der durchschnittliche Benzinverbrauch bei den 101 Testautos 
11.645 1 übersteigt. Welche Wahrscheinlichkeit für den Fehler 1. Art 
nimmt die Verbraucherorganisation dabei in Kauf, wenn mit cr=10 ge- 
rechnet werden muß? 

b) Ein kleinerer Vortest mit 9 PKW’S ergab einen durchschnittlichen Ver- 
brauch von 11 1 bei sj*_ 1 =4. Läßt sich aufgrund dieser Information und 
ohne die Grundgesamtheitsvarianz zu kennen, bereits eine Testentschei- 
dung über die Herstellerangabe treffen (a = 0.05)? 

c) Handelt es sich bei den gerade betrachteten Tests um parametrische oder 
um nicht-parametrische Tests? (Begründung!) 

d) Welche Bedeutung hat die Normalverteilungsannahme für die Testtheo- 
rie? 



Aufgabe Z/23 Einem Gemüsegroßhändler wird eine große Lieferung Ba- 
dischen Spargels zu einem sehr günstigen Preis angeboten. Der Lieferant 
behauptet, daß 20% der Spargelstangen leicht holzig seien. Der Großhändler 
entschließt sich, die Lieferung zu kaufen, wenn in einer Stichprobe von 100 
Spargelstangen höchstens 25 mangelhafte Stücke enthalten sind. 

a) Geben Sie den exakten Term zur Berechnung der Wahrscheinlichkeit 
dafür, daß der Großhändler die Lieferung nicht kauft, unter der Voraus- 
setzung, daß die Lieferantenbehauptung zutrifft. 

b) Berechnen Sie die in a) erfragte Wahrscheinlichkeit mit Hilfe einer appro- 
ximativen Verteilung. 

c) Begründen Sie die Wahl der Verteilung in b). 

d) Durch welches Modell läßt sich die Entscheidungssituation des Großhänd- 
lers beschreiben? 



Aufgabe Z/24 Bei der zentral vom „Institut für medizinisch-pharmazeuti- 
sche Prüfungsfragen“ gestellten Klausur zur ärzlichen Vorprüfung sind 320 
Fragen zu beantworten. Für jede Frage sind 5 Antwortmöglichkeiten vorge- 
geben. Nehmen wir der Einfachheit halber an, daß nur eine der gegebenen 
Antworten jeweils richtig ist. 

a) Bestimmen Sie den Ansatz zur Berechnung der Wahrscheinlichkeit dafür, 
daß ein völlig unvorbereiteter Kandidat, der die Antworten jeweils zufällig 
auswählt, die Prüfung besteht, wenn dazu die richtige Beantwortung von 
mindestens 60% aller Fragen notwendig ist. 
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b) Berechnen Sie die in a) gesuchte Wahrscheinlichkeit approximativ mit 
Hilfe einer tabellierten Verteilung. 

c) Wie groß ist die Wahrscheinlichkeit, daß ein Kandidat bestanden hat, 
der nach der Klausur sicher ist, 95 Fragen richtig beantwortet zu haben, 
bei den restlichen Fragen aber auch nach dem Zufallsprinzip jeweils eine 
Antwort ankreuzte? 



Aufgabe Z/25 Bei einem statistischen Verfahren zur Entscheidung zwi- 
schen zwei Alternativen liegen folgende Likelihoodfunktion, Schadensmatrix 
und Entscheidungsfunktion vor: 

Likelihood: Schadensmatrix: Entscheidungsfunktion: 
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di 


d 2 


EntschN^ 
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Bestimmen Sie die Risikofunktion der Entscheidungsfunktion 6. 



Aufgabe Z/26 Laut Statistischem Bundesamt (Statistisches Jahrbuch 1991) 
gliedert sich die Bevölkerung Deutschlands zum Jahresende 1989 nach Ge- 
schlecht (Y) und Alter (X) wie folgt (in Tausend): 





y = w 


y-m 




x < 15 


6154.0 


6484.7 


12638.7 


15 < x < 40 


14432.5 


15182.9 


29615.4 


40 < x < 65 


12588.7 


12476.2 


25064.9 


65 < x 


7827.9 


3965.9 


11793.8 




41003.1 


38109.7 


79112.8 



Sind die Merkmale Alter und Geschlecht unabhängig? Wie groß ist der Anteil 
der mindestens 65-jährigen Frauen an den Frauen in Deutschland? 



Anhang B 



Lösungshinweise zu den 

• • 

Übungsaufgaben 



Aufgabe 1.1/1 

Mit „Statistik“ bezeichnet man 

a) die in 1.1 beschriebenen Tätigkeiten 

b) die Ergebnisse der in 1.1 beschriebenen Tätigkeiten 

c) die Wissenschaft, die die für die in 1.1 beschriebenen Tätigkeiten erfor- 
derlichen Begriffe und Verfahren bereitstellt. 

Aufgabe 1.1/2 

Unserer Auffassung am nächsten kommt die zweite der hier angeführten De- 
finitionen. 

Aufgabe 1.2/1 

Folgende Fragen stellen sich: 

• Was sind Entwicklungsländer? Wie mißt man Einkommen, wenn mo- 
netäre Entgelte in manchen Gesellschaften keine Rolle spielen? 

• Was sind Industriestaaten? Wer gilt (in Deutschland, in den USA) als 
arbeitslos? 

• Wie mißt man den Lebensstandard? 

• Wie mißt man Aufstiege? Wo erhält man eine Liste aller öffentlichen 
Dienststellen? 

• Was ist und wie mißt man Intelligenz? 

Aufgabe 1.2/2 

a) Denken Sie an folgende Unterscheidungen: 

• quantitatives/qualitatives Merkmal 

• diskretes/stetiges/quasi-stetiges Merkmal 

• nominal- /ordinab/kardinalskaliertes Merkmal 

• gruppierte/ungruppierte Daten. 
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b) In einer Welt unbeschränkter Ressourcen sind Vollerhebungen, falls sie 
überhaupt durchführbar sind, Teilerhebungen auf jeden Fall vorzuziehen. 
Aber leben wir in einer solchen Welt? 

c) Systematische, Zufalls-, Beobachtungs- und Meßfehler. 

d) Systematische Auswahlverfahren: Die Stichprobenelemente werden so 
ausgewählt, daß die Stichprobe die Zusammensetzung der Grundgesamt- 
heit hinsichtlich von Merkmalen, die mit dem Untersuchungsmerkmal eng 
Zusammenhängen, repräsentiert. 

Aufgabe 1.3/1 

a) Ordinalskala. 

b) Gleichverteilung in den Klassen; x* = £ t . 

c) x =3401; xm = 1900; xz— 2700; rechtsschiefe Verteilung. 

d) Hier ist hoffentlich nicht der Modus als Mittelwert gemeint. 

Aufgabe 1.3/2 

In beiden Fällen wird unterstellt, daß die Streuung innerhalb der Klassen 

relativ klein, die zwischen den Klassen relativ groß im Vergleich zur Gesamt- 
streuung ausfällt. 

Aufgabe 1.3/3 

a) 



b) Stabdiagramm und Treppenfunktion. 

c ) 



Darstellung: Histogramm und Polygonzug. 

Aufgabe 1.3/4 

a) x =2100; £^=1950; 2 Modalwerte: 1000 und 2000. 

b) 



c) x =1850; £z = 1500. 

Aufgabe 1.3/5 

a) Arithmetisches Mittel. 
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b) 3 Personen. 

c) Die Aussage ist falsch, da — x) = 0 gilt. 

d) s 2 = 100 wegen Optimalitätseigenschaft von x . 

e) s 2 =0.5. 

Aufgabe 1.3/6 

x =10; s 2 =58. 

Aufgabe 1.3/7 



< X < 
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x = 4; s 2 = 2.55. 

Aufgabe 1.3/8 

a) xu = 37000. 

b) Histogramm mit f(x)=0 . 000025 auf [0, 10000], 0.00005 auf [10000,20000] 
und 0.0000125 auf [20000,40000]. 

Aufgabe 1.3/9 

(i) x 4 = 1; (ii) x 4 G {0, 1,2,3}; (iii) x 4 G {0, 1,3, 6, 7, 8, 9, 10}. 

Aufgabe 1.3/10 

a) Kreisdiagramme mit den Sektorwinkeln in Grad: 



männl/weibl 


dtsch/Ausl. 


Arb/Ang 


Voll/Teil> 1 8 /Teil <18 


211.5/148.5 


70.9/289.1 


181.7/178.3 


321.8/32.6/6.6 



b) h(Teil> 18) = 2.0096/22.8810; A(Teil> 18) = 2.0096/2.4269. 

Aufgabe 1.4/1 

a) X, Y sind abhängig. 

b) x =20. 



y 


2 4 6 8 


h(y\x = 30) 


1/3 1/12 1/3 1/4 



Aufgabe 1.4/2 



a) 
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2 


8 




6 


3 


3 


12 



b) Ja. 



Aufgabe 1.4/3 

7 =5/9, r= 5/10, n= 5/y/ÖÖ, r s = 6.5/V95. 

Aufgabe 1.4/4 

y ' = 10 + 0.004 x. 

Aufgabe 1.4/5 
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a)al) 
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a3) F( 4, 1) = 0.3. 
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Aufgabe 1.4/6 

K* = K/Kmax — 0.2828 (beide Variablen sind nominalskaliert). 

Aufgabe 1.4/7 

a) b — r — sxy • 

b) yf — 6.58 — 1.11 x. 

Aufgabe 1.4/8 

a) y' F = 66.74 + 2x]y* M = 63.08 + 1.46 x 

Für jedes Geburtsjahr ist die Lebenserwartung der Frauen tendenziell 
höher als die für die Männer, und der Abstand vergrößert sich. 

b) Bf = 0.965; Bm = 0.947 (sehr gute Anpassung der Regressionsgeraden 
an die Daten). 

Aufgabe 1.5/1 

Korrelationen erlauben keine Aussagen über Kausalitäten. 

Aufgabe 1.5/2 

Die Faktorenwerte sind nicht beobachtbar (Fi sind latente Variable). 

Aufgabe 2.1/1 

a) Die SZ benennt ein Ereignis, das ihrer Meinung nach die Wahrscheinlich- 
keit 0 besaß aber dennoch nicht unmöglich war. Solche Ereignisse sind 
nur bei Ergebnis mengen mit überabzählbar vielen Elementen möglich. 

b) Die Kenntnis aller Elementarereignisse ist notwendige Voraussetzung für 
die Formulierung eines stochastischen Modells. 

c) Risiken sind üblicherweise die mit den Wahrscheinlichkeiten gewichteten 
Konsequenzen der Ereignisse. 

d) Der Major ist sich über die Zusammenhänge zwischen „bedingte Häu- 
figkeiten“, „unbedingte Wahrscheinlichkeiten“ und „Unabhängigkeit von 
Ereignissen“ offenbar nicht im Klaren. Sie können ihm sicherlich helfen. 

Aufgabe 2.1/2 

a) Dann und nur dann, wenn mindestens eines der Ereignisse die Wahr- 
scheinlichkeit 0 hat. 
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b) W(Af)B) = W(A\B)W(B) = W(B\A)W(A). 

Sind A, B unabhängig, so gilt W(A fl B) = W(A)W(B). 
Faktorenvergleich ergibt die Behauptung. 

c) Definieren Sie W(u)i) = pi. 

Aufgabe 2.1/3 

a) 0.5. 

b) bl) 12/991; b2) 16/1024; b3) 12/991. 

Unabhängig sind die Ereignisse „Ergebnis des 1. Zuges“ und „Ergebnis 
des 2. Zuges“ in b2). 

c) Der Meteorologe bevorzugt den frequentistischen Wahrscheinlichkeitsbe- 
griff. 

d) Der erste Teil der Aussage ist allgemeingültig. Der zweite Teil gilt nur 
für diskrete Ergebnis räume. 



Aufgabe 2.2/1 

a) F(x) ist monoton nicht-fallend, rechtsseitig stetig. Es gilt 
lim :r _+_oo F(x) = 0 und lim^oo F(x) = 1. 

b) Im Prinzip ja. 



Aufgabe 2.2/2 

X=„ Augenzahlensumme beim zweimaligen Werfen eines idealen Würfels“ 
Stabdiagramm für f(x) = a/36, Treppenfunktion für F(x) = 6/36 mit 
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Aufgabe 2.2/3 

a) 7/8; b) 7/8; c) a = 2 - y/QÄ. 



d) F(x) = { 



0 

0.5a? 2 

—0.5z 2 + 2x — 1 
1 



x < 0 
0 < x < 1 
Kx<2 
x >2 



Aufgabe 2.2/4 

fi und /2 sind keine Dichten. 

Aufgabe 2.2/5 

W ( 4 < y < 6) = 0.75. 

Aufgabe 2.3/1 

a) fx(x) = f(x\y) bzw. f Y {y) = f(y\x). 

b) Z.m.Z. Z.o.Z. 
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Aufgabe 2.3/2. 

a) Randverteilungen: 



X 


-2 0 2 y 


12 3 4 


/(*) 


| 0.4 0.4 0.2 


f(y) 
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0.5 0.2 0.2 0.1 

2 3 4 


>2 

Verteilungsfunktion: 
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Bedingte Verteilungen: 
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b) 0.4; 0.2; 1. 






c) Nein. 






Aufgabe 2.3/3 
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Aufgabe 2.3/4 

Die erste Aussage gilt nur für unabhängige Zufalls variablen, die zweite ist 
nicht richtig. 

Aufgabe 2.4/1 

a) E(X ) = 7 (symmetrische Verteilung); V(X) = 5.83. 

b) E(X) = 1; V(X) = 1/6. 

Aufgabe 2 .4/2 

Aussagen a und c sind richtig; Aussage b ist korrekt, falls mit „Zusammen- 
hang“ Korrelation gemeint ist. 

Aufgabe 2.4/3 

a) E(X) = -0.4; E(Y) = 1.9. 

b) E(XY) = -0.6. 

c) E(XY) ^ E(X)E(Y) 1 also liegt Abhängigkeit vor. 

d) E(X\Y = 1) = —0.8. 

Aufgabe 2.4/4 

a) £(A) = -0.5; £(Y) = 4.8. 
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b) W(X = -1 | Y = 5) = 5/8. 

c) /(1,4) = 0 ^ 0.02 = /x(l)/y(4), also liegt Abhängigkeit vor. 

d) Cov(A, y) = 0, also liegt Unkorreliertheit vor. 

Aufgabe 2.5/1 

a) f B { 4) = 0.0543 (ßy(10, 1/6)). 
c) f B ( 0) = 0.34868 (5y(10,0.1)). 

e) f B ( 0) = 0.5905 (BV( 5, 0.1) für Z.m.Z.). 

Aufgabe 2.5/2 

a) A=„Anzahl der Kandidaten mit Dienstleistungsberufen in Stichprobe“ 

~ W(100, tt), tt = 2340/3696 = 0.633 

W(X > 20) = 1 - F b { 20) = 1 - o (TM 1 - M 0- *- 

b) X=„Anzahl der Lehrer in Stichprobe“ ~ 51^(100, tt), tt = = 0.11 

W(X > 20) = 1 - F ß (20) = 1 - £” o (TM 1 - M 0- *- 

c) X—„ Anzahl der Frauen in Stichprobe“ ~ ßy(100, tt), tt = = 0.24 

W(X > 20) = 1 - F b ( 20) = 1 - 0 (TM 1 - :r) 10 °-*. 

Aufgabe 2.5/3 

a) X=„ Anzahl der Gegner“ ~ BV{ 8,0.7) 

012345678 
.0001 .0012 .0100 .0467 .1361 .2541 .2965 .1977 .0577 

b) xm = 6; am unwahrscheinlichsten ist es, daß alle Befragten dafür sind. 

Aufgabe 2.6/1 

X=„ Anzahl Züge, bis zwei Frauen in Stichprobe“ ~ NBV(2, 0.2); 

W(X = 8)= ([)0.2 2 0.8 6 = 0.0734. 

Aufgabe 2.6/2 

X= n Anzahl der Würfe, bis zum 2. Mal 5 als Summe der Augenzahlen auf- 
tritt“ ~ NBV( 2,4/36); W(X = 5) = 0.0347. 

Aufgabe 2.7/1 

W(x > 1) = 1 - (o)Q/( X x“) = 0.416 

Das Prüfverfahren führt mit relativ hoher Wahrscheinlichkeit zur Ablehnung 
von Lieferungen, die den Vertragsbedingungen noch entsprechen. 

Aufgabe 2.7/2 
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Aufgabe 2, 


.7/3 









X= n Anzahl der Frauen in Stichprobe“ 

Z.o.Z.: X ~ HV( 10, 10449,9759); W(X = 10) = ( 9 ” 9 )/( 1, }£ 9 ) 
Z.m.Z.: X ~ 5^(10,0.934); W(X = 10) = 0.934 10 . 

Aufgabe 2.8/1 
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a) Man unterteile die Zeiteinheit T im ersten Beispiel in gleich große Zeit- 
intervalle der Länge A t so, daß innerhalb A t höchstens ein großer Scha- 
densfall auftreten kann. Dann ist A t sehr klein, und n mit T = nAt ist 
groß. Die Wahrscheinlichkeit für das Eintreten eines großen Schadenfal- 
les innerhalb A t sei nur von dieser Größe abhängig und damit klein und 
konstant. Dann kann BV(n,ic) durch PV(nw) approximiert werden. Es 
muß nur das Produkt n7r bekannt sein. 

b) Ja, falls n/N < 0.05 und n > 50 und M/N <0.1 gilt (gemäß unserer 
Approximationsregeln) . 

Aufgabe 2.8/2 

f P { 0) = 0.135; F P ( 3) = 0.857; 1 - F P ( 4) = 0.053 (A=2). 

Aufgabe 2.8/3 

a) al) X ~ PV( 1); a2 )Y ~ PV( 2). 

b) bl) 0.183; b2) 0.919; b3) 0.081. 

Aufgabe 2.8/4 
A=2. 

Aufgabe 2.8/5 
0.18 (A=2). 

Aufgabe 2.9/1 

/m( 2, 3, 5,0) = 0.0035. 

Aufgabe 2.9/2 

/m(3, 2,1) = 0.12. 

Aufgabe 2.10/1 

Aussagen a) und b) sind richtig. Der Aussage c) stimmen die meisten Stati- 
stiker ebenfalls zu. 

Aufgabe 2.10/2 

Offensichtlich erfordert die Approximation der BV durch die NV ein umso 
größeres n, je größer der Abstand \tt — || ist. 

Aufgabe 2.10/3 
^7(4.5, 0.6). 

Aufgabe 2.10/4 

a) (7=5.556; b) c=7.2. 

Aufgabe 2.10/5 

a) 0.1587; 0.4206; 0.4207; 0.2743. 

b) 23.014%. 

c) Zur Berechnung von Wahrscheinlichkeiten normalverteilter Zufallsvariab- 
ler ist lediglich die Tabelle der Standardnormalverteilung notwendig. 

Aufgabe 2.11/1 

a ) ^ Jo° e ~ Xx dx = lim x _oo(l - e~ Xx ) = 1 
/(ar) = Ae“ Ar > 0 für x > 0. 
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b) fc=l. 

Aufgabe 2.11/2 

a) f P ( 0) = 0.368; f P ( 1) = 0.368 (A=l). 

b) f P ( 0) = 0.135 (A=2). 

c) /je;( 1) = c" 1 ; /e(3) = e~ 3 (A=l). 

d) F e ( 2) = 1 - e- 2 ; F E (7) = 1 - e~ 7 (A=l). 

Aufgabe 2.12/1 

Vgl. Abschnitt 2.12. 

Aufgabe 2.12/2 

a) £=11.1; b) £=2.02; c) £=5.1. 

Aufgabe 2.13/1 

/ W = i-e-5 ( ^ 2) . 

Aufgabe 2.13/2 

a) Bis auf die vertikale Skalierung erhält man die bivariate Dichte durch 
Rotieren der Dichte der univariaten Standardnormalverteilung um die 
vertikale Achse. 

b) Konzentrische ähnliche Ellipsen. 



Aufgabe 2.14/1 

a) Unabhängigkeit der Zufalls variablen. 

b) Wahrscheinlichkeiten können durch eine große Zahl von Wiederholungen 
im Bernoulli- Versuch mit beliebiger Genauigkeit ermittelt werden. 

c) Die stochastische Konvergenz ist eine schwächere Forderung als die Kon- 
vergenz im Sinne der klassischen Analysis. 



Aufgabe 2.14/2 

100 



W{X > 30) = 

x=31 



0-414*0. 586 100-1 



BV(m, 0.414) -v* NV( 41.4, 4.93). 



0.9861 



Aufgabe 2.14/3 

Je asymmetrischer die Verteilung, desto größer das erforderliche n. 



Aufgabe 2.14/4 

W(X < 20.5) = 0.21, also keine deutliche Verbesserung festzustellen. 

Aufgabe 2.14/5 

W( 6.5<X< 12.5) = 0.65. 

Aufgabe 3.1/1 

a) Einfache Stichprobe; Z.m.Z.. 

b) Erhebungseinheit ist nicht gleich Untersuchungseinheit; keine einfache 
Stichprobe. 

c) Keine uneingeschränkte Zufallsauswahl. 

d) Keine Zufallsauswahl für die Grundgesamtheit „Einwohner der Stadt“. 
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e) Keine Zufallsauswahl (sicher keine repräsentative Auswahl). 

f) Keine Zufallsauswahl (möglicherweise keine repräsentative Auswahl). 

g) Zweistufiges Auswahlverfahren; Abschneide verfahren in der zweiten Stu- 
fe, keine einfache Stichprobe. 

Aufgabe 3.1/2 

„. . .erzielte das falsche Resultat, weil er die Wähler per Telefon auswählte. 

Dadurch erhielt er einen höheren Anteil von republikanischen Wählern (die 

im allgemeinen reicher sind und eher ein Telefon haben als Wähler, die die 

Demokraten unterstützen).“ (Kennedy (1985), S. 170). 

Aufgabe 3.2/1 

a) W(X > 60.5) = W(T > (60.5 - 50)/5) = 0.018 = W(P > 0.60 + 1/200). 

b) Die Stetigkeitskorrektur ist in beiden Fällen zu berücksichtigen. 

Aufgabe 3.2/2 

X — NV(ia, 2/3) => 1 - W(fi - l<X</i + 1) = 0.134. 

Aufgabe 3.2/3 

a) y ~ NV( 4, 9); b) X ~ NV(- 1, 1). 

Aufgabe 3.2/4 

W(X > 12) = 0.00135. 

Aufgabe 3.2/5 

n = 1724 (mit Stetigkeitskorrektur), n = 1825 (ohne Stetigkeitskorrektur). 

Aufgabe 3.3/1 

a) Schluß von der Grundgesamtheit auf die Stichprobenverteilung heißt di- 
rekter Schluß; Schluß von einer konkreten Stichprobenrealisationen auf 
die Grundgesamtheitsverteilung heißt indirekter Schluß. 

b) Die Stichprobenvariable Xi beschreibt das Ergebnis des «’-ten Zuges ei- 
ner Stichprobe vom Umfang n(i = 1, . . . , n). Stichprobenfunktionen sind 
Funktionen mit den Stichprobenvariablen als Argument. Schätzfunktion 
ist eine zur Schätzung eines Grundgesamtheitsparameters ausgewählte 
Stichprobenfunktion. Punktschätzung nennt man die Realisation einer 
Schätzfunktion. 

c) Während bei der Momentenmethode keine Informationen zur Grundge- 
samtheitsverteilung benötigt werden, sind für die Anwendung der ML- 
Methode Kenntnisse über die Grundgesamtheitsverteilung erforderlich. 

d) Vgl. Sie das Alternativkostenkonzept bei Weise et al. (1991). 

e) ln(x) ist eine monotone Transformation der Ausgangswerte x und erhält 
somit Extremwerte. 

Aufgabe 3.3/2 

a) 7 Tml = 9/40; b) 7r M o = 10/40. 

Aufgabe 3.3/3 

a) al) d — x; a2) $ = 100. 

b) a = 17. 
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c) 7T — p — 2/3. 

Aufgabe 3.3/4 

a) 7r = 0.14. 

b) 7r p = 0.05; 7Tm = 0.04; 7 f/ = 0.045. 

Aufgabe 3.4/1 

Alle Aussagen sind wahr. 

Aufgabe 3.4/2 

a) E(X) = £7(1 E” =1 X,) = i £" =1 = ±np = p. 

b) Nein; ja; nein; ja. 

c) Asymptotisch erwartungstreu. 

d) lim n _oo = t? und lim n _>oo(<7 2 + ^ 2 )/™ = 0=> Konsistenz. 

Aufgabe 3.4/3 

Ohne nähere Kenntnisse über Auswahlverfahren, Aggregierungsmethode und 
graphische Präsentation sind die Fragen nicht zu beantworten. 

Aufgabe 3.5/1 

a) Die Aussage ist falsch. 

b) Bei festem Konfidenzniveau durch Erhöhung des Stichprobenumfangs; 
Aussagesicherheit (1 -a) und Aussagegenauigkeit sind konkurrierende Kri- 
terien. 

c) Die Aussage ist wahr. 

d) Für tt= 0.5 ist die Varianz maximal. 

e) Die Grenzen des Konfidenzintervalls sind Zufallsvariablen. 

f) V(X) = <r 2 /n ist ein Maß für die Güte der Schätzfunktion = X. 

Aufgabe 3.5/2 

a) [27.44,31.36]; b) [25.272,33.528]; c) 0.9973. 

Aufgabe 3.5/3 

[0.132,0.268]. 

Aufgabe 3.5/4 

a) [72.8,77.2]; b) er 2 = 64. 

Aufgabe 3.5/5 
e=5.152. 

Aufgabe 3.5/6 

*m € [0.733,0.767]; tt f G [0.407,0.471] 

Die unterschiedlichen Intervallschätzungen legen den Verdacht geschlechts- 
spezifischer Diskriminierung bei Beförderungen nahe. Vor einem abschließen- 
den Urteil ist jedoch der Einfluß weiterer Variabler wie Alter, Ausbildung 
u.s.w. auf Beförderungen sowie die unterschiedliche Verteilung dieser Vari- 
ablen bei Frauen und Männern zu berücksichtigen (vgl. Autorengemeinschaft 
Paderborn (1989)). 

Aufgabe 3.6/1 

a) Normalverteilte Grundgesamtheit, einfache Stichprobe. 
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b) Wir ersetzen ^(Ä,- — A") 2 durch ]T^(A r t - ~ v) 2 und benutzen x 2 ^( n )- 

c) [724,1155], 

Aufgabe 3.6/2 

a) [128721,205312]; b) [476991,760811], 

c) Männliche Angestellte sind hinsichtlich des Einkommens eine heteroge- 
nere Gruppe als weibliche. Vorausgesetzt werden normal verteilte Ein- 
kommen. 

Aufgabe 3.6/3 

a)[0.00009, 0.0020833]; b) <r 2 = s 2 n _ l = 0.0004745. 

Aufgabe 3.6/4 

[30, 211.1]; Normalverteilungsannahme. 

Aufgabe 3.7/1 

a) Statistische Hypothese: eine die Grundgesamtheitsverteilung betreffende 
Annahme; Signifikanzniveau = a = Wahrscheinlichkeit für den Fehler 
1. Art; Verwerfungsbereich: liegt die Realisation der Prüfgröße in diesem 
Bereich, so wird Ho verworfen; Fehler 1. Art: H o verwerfen, obgleich Ho 
zutrifft; Fehler 2. Art: Ho beibehalten, obgleich Ho nicht zutrifft. 

b) ß < 1 — a und sup^ ß(n\) = 1 — a; falsch; wahr; wahr. 

Aufgabe 3.7/2 

a) H 0 :pL = 24000; H x : /i £ 24000; 

x = 22900 g [23600,24400] => Ho verwerfen. 

b) Fehler 1. Art; W(Fehler 1. Art)=a; unberechtigte Mängelrüge. 

Aufgabe 3.7/3 

a) Ho ’ n = 100; H\ : /i ^ 100 

x = 101.5 E [98.04, 101.96] => Ho beibehalten. 

b) x £ [99.02, 100.98] =>Ho verwerfen. 

c) Wenn a steigt, wird t a und damit der Nicht- Ablehnungsbereich kleiner. 

Aufgabe 3.7/4 

H 0 :n = 241.6; H x 241.6 
x = 258.62 £ [231.2,252] =>Hq verwerfen. 

Ohne Berücksichtigung weiterer Daten z.B. Bevölkerungsdichte, Altersstruk- 
tür usw. kann aus der signifikanten Abweichung nicht auf eine bessere Ver- 
sorgung im Gesundheitswesen in NRW geschlossen werden. 

Aufgabe 3.8/1 

Die erste Aussage ist richtig, da die Wahrscheinlichkeit für den Fehler 
1. Art kontrolliert wird. Die zweite Aussage trifft ebenfalls zu: die Inter- 
vallschätzung enthält genau die Werte, die als //o nicht verworfen werden. 

Aufgabe 3.8/2 

a) Ho : H < 8; H\ : // > 8. 

b) x > x k — 8.1645. 

c) /?=0. 84135. 
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d) Normalverteilungsannahme; Xk = 8.329. 

Aufgabe 3.8/3 

a) Ho : 7r = 0.6; H\ : 7r ^ 0.6 

|t r | = 1.22 < L96=>üTo beibehalten. 

b) /?»0. 

c) Gütefunktion oder Operationscharakteristik. 

Aufgabe 3.8/4 

a) Ho : p = 16; H\ : p ^ 16 

ä* = 15 E [14.1, 17.9]=>/fo beibehalten. 

b) / r = — 1.1 > — 1.7 = — < 2 a =>Ho beibehalten. 

c) öl > 0.277. 

d) Der Mittelwertetest A ist trennschärfer als der Mittelwertetest B (jeweils 
gleiches a), wenn gilt: ßA(pi) < ßß(pi) für alle p i mit Ungleichheit für 
mindestens ein p\. 

Aufgabe 3.8/5 

Ho : Tr > 0.88; : 7r < 0.88; p = 0.854 > 0.87 = pk => Ho verwerfen. 

Aufgabe 3.9/1 
[1.48,29.6]. 

Aufgabe 3.9/2 

H 0 :<t 2 = 1; Hi'.a 2 ^ 1; *r = 20 E [2.6, 23.2 ]=>H 0 beibehalten. 

Aufgabe 3.9/3 

a) Ho : <t 2 < 100; H 1 :<r 2 > 100; x 2 r = 122.2 < 124.3 =>H 0 beibehalten. 

b) 0=0.9. 

Aufgabe 3.10/1 

a) Im Falle einer stetig verteilten Prüfgröße kann der zweiseitige Test so 
konstruiert werden, daß W(Fehler 1. Art)=a gilt. Ist die Prüfgröße diskret 
verteilt, so kann lediglich W(Fehler 1. Art)< a garantiet werden. 

b) X:„ Anzahl Merkmalsträger in der Stichprobe“; X{ E {0, 1, . . . , n). 

c) T = y/n(X - ß)/S n - 1 • 

Aufgabe 3.10/2 

a) ß = x = 2500; & 2 = s = 57000. 

b) 2203 < p < 2796.8; 2054.05 < er 2 < 475000. 

Aufgabe 3.10/3 

Ho : 7r < 0.2; H\ : n > 0.2 

W(X > 3) = 1 - ELo (^ O )0.2-0.8 10 — = 0.323 >a=^H 0 beibehalten. 
Aufgabe 3.11/1 

a) Nominalskalierte Daten; ej >5. 

b) Rechtsseitiger Test. 

c) Für kleine Stichproben dürfte ej > 5 nicht für alle j erfüllt sein. 




199 



Aufgabe 3.11/2 

Xr = 4 > 3.84 = xl = > #o (jedes zweite Los gewinnt) verwerfen. 

Aufgabe 3.11/3 

Xr = 20 > 12.6 = x\=>Ho (Unfallgefahr an allen Wochentagen gleich) 
verwerfen. 

Aufgabe 3.11/4 

Xr = 0.4 < 7.81 = xl =>^0 (alle Farben sind gleich-häufig) beibehalten. 

Aufgabe 3.11/5 

a) H 0 : Der Würfel ist fair; xl = 7 < 11.1 = x* => Ho beibehalten. 

b) n = 30. 

c) Entscheidung auf Ho, obgleich der Würfel nicht fair ist. 

Aufgabe 4.1/1 

Falsch; wahr; wahr. 

Aufgabe 4.1/2 

a) [6.08, 13.92]; b) [6.08,13.92]. 

Aufgabe 4.1/3 

a) [1974.52,2025.48]. 

b) s^ in2 = 8450; gleiches Intervall wie in a). 

c) [-0.056,0.256]. 

Aufgabe 4.1/4 

[0.009,0.19]. 

Aufgabe 4.1/5 
a=0.0455. 

Aufgabe 4.1/6 

a) [—0.4544,0.6544]; b) Nein. 

c) Falls die Normalverteilungsannahme für beide Jahre gilt, läßt sich mit 
Hilfe der Student- Verteilung ein Konfidenzintervall bestimmen. 

Aufgabe 4.1/7 

a) Tr = 0.18; b) [-0.14,0.24]. 

Aufgabe 4.2/1 

Schlagen Sie die Definitionen in Kapitel 3 nach. 

Aufgabe 4.2/2 

a) Differenzentest für Mittelwerte; approximativer Gauß- Test (kleiner Aus- 
wahlsatz und n > 30); 

#o • f*i — fi>2 = 0; H\ : ^ ^ 0; D = 3.2 > 2 = Dk => Ho verwerfen. 

b) [4/3, 8/3]. 

c) Normalverteilung. 

Aufgabe 4.2/3 

a) Ho : — Pa < 0; H\ : hb — Ha > 0; D = 9/2.02 > 2.576 = <2a => Ho 

verwerfen. 
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b) [4.96,13.04], 

Aufgabe 4.2/4 

a) H 0 : pa ~ Hb = 0; # i : ha - PB ± 0;_ 

Nicht-Ablehnungsbereich für ( Xa — Xb)' [—0.98,0.98]. 

b) 0=0.02. 

Aufgabe 4.3/1 

a) [0.294,3.4]; b) [0.625,1.5]. 

Aufgabe 4.3/2 

a) Normalverteilte Zufallsvariablen. 

b) H 0 ■ = a\-, Hi : £ <r\. 

c) Zweiseitiger Test. 

d) F r = 0.25 ^ [0.256,4.2] =>Ho verwerfen. 

Aufgabe 4.4/1 

a) Vergleichen Sie den jeweiligen Text. 

b) Nominalskala. 

c ) X 2 > 0; Xr > x\\ erhöht sich v , so erhöht sich ceteris paribus xl- 

Aufgabe 4.4/2 

X 2 = 292.68 > 7.81 = x\ =f >H$ (Nationalität und Interesse sind un- 
abhängige Merkmale) wird verworfen. 

Aufgabe 4.4/3 





Ja 


Nein 




Land 


100 


100 


200 


Stadt 


200 


100 


300 




300 


200 


500 



b) x 2 = 13.89 > 3.84 = xl => Hq (Unabhängigkeit) verwerfen. 

c) Es besteht ein Zusammenhang zwischen Wohnort und Relevanz der Um- 
weltpolitik für die Wahlentscheidung. 

Aufgabe 4.5/1 

a) Zur Überprüfung der Hypothese, daß Grundgesamtheitsmittelwerte aus 
r > 2 Grundgesamtheiten übereinstimmen, verwendet man die Vari- 
anzanalyse. Der Name weist auf die bei diesem Test verfahren benutzte 
Prüfgröße hin. 

b) Die Prüfgröße setzt (bis auf einen Faktor, der von der Zahl der Grundge- 
samtheiten und dem Stichprobenumfang abhängt) die externe Streuung 
zur internen ins Verhältnis. Die Prüfgröße nimmt kleine positive Werte 
an, falls die externe Streuung klein ist (keine großen Unterschiede zwi- 
schen den Stichprobenmittelwerten) und/oder die interne Streuung groß 
ist (heterogene Stichproben). In diesem Falle wird die Hypothese, die 
Grundgesamtheitsmittelwerte seien identisch, offenbar gestützt. 

Aufgabe 4.5/2 
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Hq : fi\ = H 2 = Hs = // 4 ; H\ : /i, ^ Hj für mindestens ein Paar i,j. 

D = 1.44 < 3.2 = F*(3, 16)=*tf 0 beibehalten. 

Aufgabe 4.5/3 

a) Hq : ha == Hb = Vc — HD ', H\ : fr ^ fij für mindestens ein Paar i,j. 

F = 0.164 < 4.4 = Ffc(3, 7)=$>Hq beibehalten. 

b) Unabhängige Stichproben, Normalverteilungsannahme für alle Grundge- 
samtheiten, Varianzhomogenität, Kardinalskala. 

Aufgabe 4.6/1 

Nach Durcharbeiten des Textes fällt Ihnen die Antwort sicherlich nicht 
schwer. 

Aufgabe 4.6/2 

a) V(Yi) = V(ß 0 + ßxxi + Ui) = V(Ui), E(Yi) = ßo + ßix { + E(Ui). 

b) Ist s 2 x = 0, so ist sowohl B\ als auch Bq nicht definiert. Gilt s\ « 0, so 
ist Sßj sehr groß und die Schätzwerte sind sehr ungenau. 

Aufgabe 4.6/3 

a) y=„ Lärmemission in db(A)“; X=„ Fahrgeschwindigkeit“. 

b) Y = 45.52 -f 0.408x. Steigt die Fahrgeschwindigkeit um 1km/h so steigt 
die Lärmemission im Durchschnitt um 0.408 db(A). 

c) Unter den gemachten Annahmen (Linearität, Störvariablen mit Erwar- 
tungswert 0, Homoskedastie, keine Autokorrelation) sind die KQ-Schätzer 
effizient in der Klasse aller linearen erwartungstreuen Schätzfunktionen. 
Gilt zusätzlich die Normalverteilungsannahme, so gilt die Effizienz für die 
Klasse aller erwartungstreuen Schätzfunktionen. 

d) Falls die Normalverteilungsannahme gilt, kann ein Test mit der Student- 
Verteilung durchgeführt werden. 

Aufgabe 4.7/1 

Sind X,Y zweidimensional normal verteilt, so gilt: X,Y sind unkorreliert 
genau dann, wenn X,Y unabhängig sind. Im allgemeinen ist die Unkorre- 
liertheit keine hinreichende Bedingung für die Unabhängigkeit zweier Zufalls- 
variabler. 

Aufgabe 4.7/2 

a) g — r — 0.63. 

b) Schwacher gleichläufiger Zusammenhang. 

c) G q = R ist nicht erwartungstreu. Die Konsistenz der Schätzfunktion ist 
für die vorliegende kleine Stichprobe wohl weniger von Belang. 

d) Korrelationsmodell. 

Aufgabe 4.7/3 

a) i?(A r -|- Y) = 4; b) Falsch; wahr; wahr; falsch. 

Aufgabe 5.1/1 
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a) 0 12 

0 0 0 0 

1 -40 6 6 

2 -80 -34 12 

b) Setzt man Geldeinheiten hier mit Nutzeneinheiten gleich — was nicht 
unproblematisch ist — so kann man für U die identische Abbildung, also 
U(Rij) = Rij, wählen. 

c) Individuelle Entscheidung; Spiel gegen die Natur; Entscheidung unter Un- 
gewißheit; einstufiger Entscheidungsprozeß. 

Aufgabe 5 . 1/2 

a) nicht gestehen gestehen 

nicht gestehen (- 600 ,- 600 ) (-10000,-100) 

gestehen (-100,-10000) (-1000,-1000) 

Dabei ist die „Auszahlung“ für Person i jeweils die i-te Komponente 
(i=l, 2 ) des Auszahlungsvektors. 

b) Unabhängig von der Wahl der anderen Person ist „Gestehen“ für jeden 
Aktor vorteilhaft, obgleich das Ergebnis für beide nicht befriedigend ist. 

c) Konkurrenzsituation; spieltheoretisches Modell. 

d) Wir meinen: ja (Vgl. Weise ( 1991 ), 3 . 5 ). 



Aufgabe 5 . 1/3 

a) 


schlecht 


normal 


gut 


Sparen (ai) 


1000 


1000 


1000 


Aktien (02) 


-100 


1000 


2000 


Anteile (03) 


800 


900 


1500 


b) a 2 ; a\ \ a 2 und 


03; a\ und 


« 3 - 





Aufgabe 5 . 2/1 

a) Die statistische Entscheidungsfunktion ordnet jeder Stichprobenreali- 
sation eine Letztentscheidung zu. Die Risikofunktion ordnet jedem 
Paar (Umweltzustand, Entscheidungsfunktion) den erwarteten Schaden 
unter Berücksichtigung der möglichen Stichprobenrealisation zu. Ein 
gleichmäßig bestes statistisches Verfahren dominiert alle anderen Verfah- 
ren einer bestimmten Klasse. 

b) Die mit den Fehlentscheidungen verbundenen Konsequenzen werden be- 
wertet und bei der Auswahl des statistischen Verfahrens berücksichtigt. 



Aufgabe 5 . 2/2 

a) Ho :tt = 0 . 1 ; : tt = 0 . 25 . 

b) d 0 : Ho beibehalten; di : H 0 verwerfen. 




d) 6 k (x) = 



do falls x < k 

d\ falls x > ek 



definiert für k = —1, 0, 1, 2 , 3 mit x — 



X{ und Xi — 0, falls die i-te 
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gezogene Schraube nicht defekt ist, bzw. x, = 1, falls diese defekt ist, 5 
statistische Entscheidungsfunktionen. 

e ) 



f) 



Aufgabe 5.3/1 

a) Ein risikoneutraler Spieler, der sich am Erwartungswert des monetären 
Gewinns orientiert, würde einen Einsatz von +oo akzeptieren (Petersburg- 
Paradoxon). 

b) Offenbar ist es nicht sinnvoll für U die identische Abbildung zu wählen. 
Entsprechend dem Gesetz vom abnehmenden Grenzertrag wird in der 
mikroökonomischen Literatur deshalb z.B. die logarithmische Funktion 
als Bewertungsfunktion vorgeschlagen. Dann löst sich das Petersburg- 
Paradoxon auf. 

c) Kardinalskala. 

Aufgabe 5.3/2 

a) : „Schneefall an den Weihnachtstagen“ $2- „Kein Schneefall an den 
Weihnachtstagen“ <p( i?i) = 0.1; ^>($ 2 ) = 0-9. 

b) ^>(i?i|X =„ Schneefall angesagt “)=0.31; 

^($2 |A =„Schneefall angesagt “)=0.69. 

Aufgabe 5.3/3 

a) 03 , b) fli ) c) o> 2 . 

Aufgabe 5.3/4 

a) ü 2 \ b) as] c) 62 . 

Aufgabe 5.4/1 

a) Prinzip des unzureichenden Grundes: es liegen keine Informationen vor, 
die dafür sprechen, von der Gleichverteilung abzuweichen (Laplace- Regel); 
Vorsichts-Prinzip, Pessimismus (Wald- Regel) ; subjektive Gewichtung des 
besten und des schlechtesten Ergebnisses (Hurwicz- Regel); Minimierung 
des Bedauerns nach getroffener Wahl (Savage-Niehans-Regel). 

b) In Situationen, in denen der Gewinn des einen Spielers dem Verlust des 
anderen Spielers entspricht, muß jeder Spieler damit rechnen, daß der 
andere ihn soweit wie möglich schädigen will. 

c) Wald-Regel. 

Aufgabe 5.4/2 
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Regel 


a* 


b) Regel 


a* 


Laplace 


ao 


Laplace 


03 


Wald 


ao 


Wald 


ai 


Hurwicz (0.5) 


ao 


Hurwicz (0.5) 


ct3 


Hurwicz (0.9) 


Ö2 


Hurwicz (0.9) 




Sav.-Nieh. 


ao 


Sav.-Nieh. 


«3 



c) Zu pessimistisch; konsequente Anwendung führt zur Vermeidung feist je- 
der Aktivität. 

Aufgabe 5.4/3 



Regel 


6* 


Laplace 


$2 


Wald 


6i 


Hurwicz 


63 


Sav.-Nieh. 


61 



Aufgabe Z/1 

{ 0.25 für 0 < x < 2 

0.5.r - 0.75 für 2 < x < 3 
0 sonst 

b) E(X) = 43/24; c) 7/16; d) 2.62. 

Aufgabe Z/2 

a) ß = x = 1000. Da keine Angaben über die Grundgesamtheitsverteilung 
vorliegen, ist die ML-Methode nicht anwendbar, 

b) [933.36,1066.64]. 

c) Ho : /i < 966; H\ : // > 966; t r = 1 < 1.645 = * 2 a => Ho beibehalten, 

d) Student- Verteilung ist Test Verteilung der Prüfgröße T = (X — /i)/S n _i 
bei normalverteilter Grundgesamtheit. 

Aufgabe Z/3 

a) ß — x — 2425. 

b) Ho : X - ^1/(2500, 1000); H x : X ^ VV(2500, 1000) 

Xr = 19.85 > 7.81 = x§ 0 5 )3 =>#o verwerfen, 

c) Hq : n = 2500; H\\ 2500; t r = 0.7 < 1.96 = => H 0 beibehalten, 

d) 2216 < \i < 2634; 868538 < er 2 < 1516606 (bei normalverteilter Grund- 
gesamtheit, mit i^~100, da v=99 nicht tabelliert). 

Aufgabe Z/4 

a) Da die gesuchte Wahrscheinlichkeit 0.38 beträgt, läßt sich die Behauptung 
7r=0.5 (gleich Spielstärke) für alle a < 0.38 aufrechterhalten, 
b) Ho : 7r = 0.5; H\ : 7r ^ 0.5; t r = 2 > 1.96 = tk =>Hq verwerfen, 

c) Für a) gilt: n7ro(l - 7To) = 2.5 < 9, also Binomialtest. 

Für b) gilt: n7To(l — 7To) = 25 > 9, also Gauß-Test, 

d) Konstante Spielstärke der beiden Spieler während der ganzen Serie wird 
vorausgesetzt. 

Aufgabe Z/5 
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10 /200\ / 800 \ /200W800\ 5 /195W795\ 

W( Abi 1 — V ^ x ' i V 5 M 5 / V- ^ x 

<%) vv yi\v i.) — / 1000 \ ^ / 1000 \ / 990 \ 

x=6 V 10 / V 10 / x—2 V 5 / 

b) Die Stetigkeitskorrektur ist anzu wenden, wenn man eine diskrete Vertei- 
lung durch eine stetige approximiert. 

c) Approximation der Binomialverteilung, wenn tt klein und n groß ist; Mo- 
dellierung von Warteschlangenproblemen. 



Aufgabe Z/6 

a) Kein x 2 -Unabhängigkeitstest möglich, da häufbares Merkmal vorliegt. 

b) 0.08 < P gym - P g es < 0.32. 

c) Statistisch signifikante Abweichungen müssen nicht unbedingt praktisch 
relevant sein. 



Aufgabe Z/7 

a) H o : 7 r = 0.25; H\ : w / 0.25; |* r | = 1.15 < 1.96 = tk =>Ho beibehalten. 

b ) E*=o a°)0.25*0.75 10 -*. 

c) Linksseitiger Binomi ältest. 

d) Ho : 7 Ti = 7 r 2 ; H i : 7 Ti ^ 7 ^; t r = 0.43 < 1.645 = tk => Ho beibehalten. 

Aufgabe Z/8 

a) Momentenmethode: ß = 100. 

b) Effiziente Schätzfunktionen sind Schätzer mit minimaler Varianz in einer 
vorgegebenen Klasse von erwartungstreuen Schätzfunktionen. 

c) [83.83,116.17]; es wurde er = s n _i = 16.96 und t = 2.132 aus SV(A) 
verwendet. 

d) Schätz verfahren: Verfahren der Grundgesamtheitsverteilung und/oder 
deren Parameter aufgrund von Stichprobe(n); Test verfahren: Verfahren 
zur Überprüfung einer statistischen Hypothese über Grundgesamtheits- 
verteilung und/oder deren Parameter aufgrund von Stichprobe(n). 

Aufgabe Z/9 

a) o 2 j , Ö 3 , fl 2 * 

b) Die Entscheidungsregeln lassen sich durch Axiome charakterisieren, die 
man als Anforderungen an rationales Handeln eines Individuums inter- 
pretieren kann (Milnor (1954)). Hier führen diese Regeln aber zu ver- 
schiedenen optimalen Aktionen. 

c) Die Konsequenzen einer Handlung stehen nicht mit Sicherheit fest. 

Aufgabe Z/10 

A-priori-Wahrscheinlichkeiten: <p(*?a) = 0.6 = 1 — <p(d b ) 

Schadensmatrix: Likelihood: 





d A 


Ob 




0 A 


da 


d A 


0 


100 


X = 0 


0.95 


0.1 


dß 


80 


0 


X = 1 


0.05 


0.9 




206 



Entscheidungsfunktionen : 


Risikofunktion: 




X = 0 


X = 1 


t 9a 


Ob 


«i 


d>A 


d A 


0 


100 




dA 


dß 


4 


90 


6 3 


dß 


dA 


76 


10 


Sa 


dß 


dß 


80 


0 


6* = 


« 2 ; « 2 ( 1 ) - 


dß. 







Aufgabe Z/11 

\ ti \ / -0.5x + l 

a ) /(*) = | o 



für 0 < x < 2 
sonst 



b) f{x) > 0; JZtfWdz = 1; F(b) = /‘ c 
Punkte in denen / stetig ist. 

f 0 für x < 0 

c) F(x) = < — 0.25x 2 + x für 0 < x < 2 



f(x)dx ; /(x) = .F'(x) für alle 



sonst 



d) xz — 2 — \/2. 

e) xa/ = 0 < x^ < E(X) = 2/3. 



Aufgabe Z/12 

a) Hq : ix < 3; H\ : p > 3; t r = 20 > 1.645 = ==> #o verwerfen. 

b) #o • Tr = 0.2; Hi : 7T ^ 0.2; t r = 2.5 > 1.96 = =>Hq verwerfen. 

c) In a) gilt: n = 400 > 30 (Zentraler Grenzwertsatz); 

in b) gilt: 7i7To(l — fio) = 64 > 9 (Zentraler Grenzwertsatz). 



Aufgabe Z/13 

a) Wahrscheinlichkeitsfunktion bzw. Dichtefunktion oder Verteilungsfunk- 
tion. 

b) Diskrete Zufallsvariable nehmen nur endlich oder abzahlbar unendlich 
viele Werte mit positiver Wahrscheinlichkeit an. Stetige Zufallsvariable 
haben kontinuierlich viele Ausprägungen. 

c) 0.75; 0.3125; 0.5. 

Aufgabe Z/14 

a) [0.302,0.498]. 

b) H o : 7r > 0.5; H\ : ir < 0.5; t r = — 2 < -1.645 = tk ==> H 0 verwerfen, d.h. 
die Meinung des Politikers wird bestätigt. 



Aufgabe Z/15 
a) 0.00275; b) ( 1 6 °)0.92 6 0.08 4 . 
c) Ei“« 0 - 9 * 0 -! 100- *; d ) f p( 1 °) = 0.997 ( A = 4 )- 
Aufgabe Z/16 

a) Umweltzustände, Aktionen, Konsequenzen, Bewertungsfunktion, Ent- 
scheidungskriterien, Rationalitätsannahme. 

b) Entscheidungstheoretische Modelle strukturieren die Auswahl eines stati- 
stischen Verfahrens unter Berücksichtigung der bewerteten Konsequenzen 
der Fehlentscheidungen. 
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c) Schadensfunktion: Bewertung der Konsequenz einer Aktion bei Vorlie- 
gen eines bestimmten Umweltzustandes; statistische Entscheidungsfunk- 
tion: Abbildung der Menge der möglichen Stichprobenrealisationen auf 
die Menge der Letztentscheidungen; Risikofunktion: Bewertung der stati- 
stischen Verfahren bei Vorliegen alternativer Umweltzustände mittels des 
Erwartungswertkonzeptes. 

d) <5* =62- d) Nein. 

Aufgabe Z/17 

a) Ein Zufallsexperiment ist ein Vorgang, der nach bestimmten Regeln 
abläuft, dessen mögliche Ausgänge bekannt sind, aber dessen konkretes 
Ergebnis vor Durchführung des Experimentes unbekannt ist. Zufallsex- 
perimente lassen sich durch Zufallsvariable beschreiben. 

b) Beiden Verhaltensweisen liegen Fehlschlüsse zugrunde (welche?). 

c) i/( 4 6 9 );(D(f)/( 4 6 9 );EL3(P( 6 4 - 3 J/( 4 6 9 )- 

d) J. Groß meint, in der Politik gebe es nur Entscheidungen unter Unge- 
wißheit. Die zweite Meldung belegt, daß auch sehr unwahrscheinliche 
Ereignisse möglich sind. 

Aufgabe Z/18 

a) y' = 3.414 + 0.265z. 

b) Jede statistische Einheit wird nach zwei Merkmalen gleichzeitig unter- 
sucht. 

Aufgabe Z/19 

a) [0.09412,0.10588]. b) [0.0412,0.1588]. 

c) Bezeichnet man als Aussgesicherheit die Wahrscheinlichkeit 1-a und mißt 
man die Aussagegenauigkeit mit e, so gilt ceteris paribus: eine Erhöhung 
der Aussagesicherheit führt zu einer Verschlechterung der Aussagegenau- 
igkeit und umgekehrt. 

Aufgabe Z/20 

a) 





y< 20 


20 < y < 40 


40 < y < 60 


y > 60 




X < 20 


0.04 


0.16 


0 


0 


0.20 


20 < x < 40 


0.01 


0.60 


0.09 


0 


0.70 


40 < x < 60 


0 


0.04 


0.03 


0.02 


0.09 


x > 60 


0 


0 


0 


0.01 


0.01 




0.05 


0.80 


0.12 


0.03 


1.00 



X, Y sind abhängig. 

b) E(X) = 1.91; E(Y) = 2.13. 

Die Quantifizierung nominalskalierter Daten ist problematisch, da die 
daraus berechneten Maßzahlen von der gewählten numerischen Skala 
abhängen. 

c) W(X < 20, Y < 20) = 0.04 aber W(X < 20 | Y < 20) = 0.8. 

d) Dise Aussage ist nur für unabhängige Zufallsvariable richtig. 
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Aufgabe Z/21 

a) t a = 2 => 1 — a = 0.9545. 

b) 6-^/n = 3 • 340 => n = 225. 

c) Die Aussagegenauigkeit läßt sich — ohne die Aussagesicherheit zu senken 
— durch Erhöhung des Stichprobenumfangs verbessern. 

d) Intervallschätzung der Grundgesamtheitsvarianz. 

Aufgabe Z/22 

a) a = W(X > 11.645) = 0.05 (/i = 10, <r = 10). 

b) Gilt die Normalverteilungsannahme für die Grundgesamtheit, so kann mit 
Hilfe der Student- Verteilung ein Test durchgeführt werden: 

Ho : p < 10; H\ : /i > 10; t r = 1.5 < 1.86 = 05 => Ho beibehalten. 

c) Parametrische Tests. 

d) Exakte Gauß-Tests und SV-Tests erfordern die Normalverteilungsan- 
nahme. 

Aufgabe Z/23 

a) W(X > 25) = C^O^O.S 100 "*. 

b) W(X > 25.5) = W(T > (25.5 - 20)/4) = 0.09. 

c) ri7r(l — 7r) = 16 > 9 (Zentraler Grenzwertsatz). 

d) Entscheidung unter Ungewißheit. 

Aufgabe Z/24 

a) W(X > 192) = £r=i 92 ( 3 f )0.2 r 0.8 32 °- i: . 

b) nn(l -n) = bl.2> 9 => X NV(64 J.1G) ^s>W(X > 191.5) « 0. 

c) «7r( 1 — 7r) = 36 > 9 => X NV( 45, 6) =► W(X > 96.5) « 0. 

Aufgabe Z/25 



X 


6(x) 


L(6(x),d)W(x\d )) 
d — d\ d = c?2 


0 


di 


0 0.8 


50 • 0.3 


l 


d 2 


100-0.2 


0 0.7 


r(6,d) = ^ x L(6(x),d)W( X \d) 


20 


15 



Aufgabe Z/26 

X, Y sind abhängig; p= 7827.9/41003.1 = 0.19. 
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Tabelle 1 Poisson-Verteilung 

Werte F(x) der Verteilungsfunktion von PV( A) 
(Zeilen: A; Spalten: x) 





0 


1 


2 


3 


4 


5 


6 


7 


8 


9 


10 


11 


12 


13 


0.1 


0.905 


.995 


.999 
























0.2 


.818 


.982 


.999 
























0.3 


.741 


.963 


.996 


.999 






















0.4 


.670 


.938 


.992 


.999 






















0.5 


.606 


.910 


.986 


.998 


.999 




















0.6 


.548 


.878 


.977 


.997 


.999 




















0.7 


.497 


.844 


.966 


.994 


.999 




















0.8 


.449 


.809 


.952 


.991 


.999 




















0.9 


.416 


.773 


.937 


.987 


.998 


.999 


















1.0 


.368 


.736 


.919 


.981 


.996 


.999 


















1.1 


.333 


.699 


.900 


.974 


.994 


.999 


















1.2 


.301 


.662 


.879 


.966 


.992 


.998 


.999 
















1.3 


.273 


.627 


.857 


.957 


.989 


.997 


.999 
















1.4 


.247 


.592 


.834 


.947 


.987 


.996 


.999 
















1.5 


.223 


.558 


.809 


.934 


.981 


.995 


.999 
















1.6 


.202 


.525 


.783 


.921 


.976 


.994 


.999 
















1.7 


.183 


.494 


.758 


.908 


.972 


.994 


.999 
















1.8 


.165 


.462 


.730 


.891 


.963 


.989 


.997 


.999 














1.9 


.150 


.434 


.704 


.875 


.956 


.987 


.997 


.999 














2.0 


.135 


.406 


.677 


.857 


.947 


.983 


.996 


.999 














2.1 


.123 


.380 


.650 


.839 


.938 


.980 


.995 


.999 














2.2 


.111 


.355 


.623 


.820 


.928 


.976 


.993 


.998 


.999 












2.3 


.100 


.331 


.596 


.799 


.916 


.970 


.991 


.998 


.999 












2.4 


.091 


.309 


.570 


.779 


.904 


.964 


.988 


.996 


.999 












2.5 


.082 


.287 


.544 


.758 


.892 


.959 


.987 


.995 


.999 












2.6 


.074 


.267 


.518 


.736 


.877 


.951 


.983 


.995 


.999 












2.7 


.067 


.249 


.494 


.715 


.864 


.944 


.980 


.994 


.999 












2.8 


.061 


.231 


.469 


.691 


.847 


.934 


.975 


.991 


.997 


.999 










2.9 


.055 


.215 


.446 


.670 


.832 


.926 


.971 


.990 


.997 


.999 










3.0 


.050 


.199 


.423 


.647 


.815 


.916 


.966 


.988 


.996 


.999 










4.0 


.018 


.092 


.238 


.343 


.629 


.785 


.889 


.950 


.979 


.992 


.997 


.999 






5.0 


.007 


.040 


.125 


.265 


.441 


.616 


.762 


.867 


.932 


.968 


.986 


.995 


.999 




6.0 


.003 


.017 


.062 


.151 


.285 


.446 


.606 


.744 


.847 


.916 


.957 


.980 


.991 


.996 


7.0 


.001 


.007 


.030 


.082 


.173 


.300 


.447 


.590 


.721 


.836 


.907 


.943 


.975 


.982 


8.0 




.003 


.014 


.042 


.100 


.191 


.313 


.453 


.592 


.717 


.816 


.888 


.936 


.966 


9.0 




.002 


.006 


.021 


.055 


.115 


.207 


.370 


.453 


.581 


.704 


.801 


.878 


.928 


10.0 




.001 


.003 


.010 


.029 


.067 


.130 


.220 


.333 


.458 


.583 


.697 


.792 


.865 


20.0 
















.001 


.002 


.005 


.011 


.021 


.039 


.066 
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Tabelle 2 Standardnormalverteilung 

Ausgewählte Werte für Wahrscheinlichkeiten symmetrischer Schwankungsin- 
tervalle: 



$(<) = W(-t <T<t),T~ NV{ 0, 1) 



t 


m 


t 


m 


t 


m 


0.0 


0.00000 


1.4 


0.83849 


2.576 


0.99000 


0.1 


0.07966 


1.5 


0.86639 


2.6 


0.99068 


0.2 


0.15852 


1.6 


0.89040 


2.7 


0.99307 


0.3 


0.23582 


1.645 


0.90000 


2.8 


0.99489 


0.4 


0.31084 


1.7 


0.91087 


2.9 


0.99627 


0.5 


0.38292 


1.8 


0.92814 


3.0 


0.99730 


0.6 


0.45149 


1.9 


0.94257 


3.291 


0.99900 


0.7 


0.51607 


1.96 


0.95000 


3.5 


0.99953 


0.8 


0.57629 


2.0 


0.95450 


4.0 


0.9999366 


0.9 


0.63188 


2.1 


0.96427 


4.5 


0.9999932 


1.0 


0.68269 


2.2 


0.97219 


5.0 


0.99999942 


1.1 


0.72867 


2.3 


0.97855 


5.5 


0.99999996 


1.2 


0.76986 


2.4 


0.98360 


6.0 


0.999999998 


1.3 


0.80640 


2.5 


0.98758 







Tabelle 3 Chi-Quadrat-Verteilung 
Fraktile t p : W(T <t p ) = p,T~ x 2 V(v) 
(Zeilen: v\ Spalten: p) 





0.001 


0.01 


0.025 


0.05 


0.1 


0.9 


0.95 


0.975 


0.99 


0.999 


1 


0.00 


0.00 


0.00 


0.00 


0.02 


2.71 


3.84 


5.02 


6.63 


10.8 


2 


0.00 


0.02 


0.05 


0.10 


0.21 


4.61 


5.99 


7.38 


9.21 


13.8 


3 


0.02 


0.11 


0.22 


0.35 


0.58 


6.25 


7.81 


9.35 


11.4 


16.3 


4 


0.09 


0.30 


0.48 


0.71 


1.06 


7.78 


9.49 


11.1 


13.3 


18.5 


5 


0.21 


0.55 


0.83 


1.15 


1.61 


9.24 


11.1 


12.8 


15.1 


20.5 


6 


0.38 


0.87 


1.24 


1.63 


2.20 


10.6 


12.6 


14.4 


16.8 


22.4 


7 


0.60 


1.24 


1.69 


2.17 


2.83 


12.0 


14.1 


16.0 


18.5 


24.3 


8 


0.86 


1.65 


2.18 


2.73 


3.49 


13.4 


15.5 


17.5 


20.1 


26.1 


9 


1.15 


2.09 


2.70 


3.33 


4.17 


14.7 


16.9 


19.0 


21.7 


27.9 


10 


1.48 


2.56 


3.25 


3.94 


4.86 


16.0 


18.3 


20.5 


23.2 


29.6 


100 


61.92 


70.06 


74.22 


77.93 


82.36 


118.5 


124.3 


129.6 


135.8 


149.4 
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Tabelle 4 Student-Verteilung 

Kritische Grenzen t % v : W(— t^ v < T < t^ v ) = 1 — a, T ~ SV(v) 
(Zeilen: v\ Spalten: a) 





0.10 


0.05 


0.01 


0.001 


1 


6.31 


12.71 


63.66 


636.37 


2 


2.92 


4.30 


9.93 


31.60 


3 


2.35 


3.18 


5.84 


12.92 


4 


2.13 


2.78 


4.60 


8.61 


5 


2.02 


2.57 


4.03 


6.87 


6 


1.94 


2.45 


3.71 


5.96 


7 


1.90 


2.37 


3.50 


5.41 


8 


1.86 


2.31 


3.36 


5.04 


9 


1.83 


2.26 


3.25 


4.78 


10 


1.81 


2.23 


3.17 


4.59 


11 


1.80 


2.20 


3.11 


4.44 


12 


1.78 


2.18 


3.06 


4.32 


13 


1.77 


2.18 


3.01 


4.22 


14 


1.76 


2.15 


2.98 


4.14 


15 


1.75 


2.13 


2.95 


4.07 


16 


1.75 


2.12 


2.92 


4.02 


17 


1.74 


2.11 


2.90 


3.97 


18 


1.73 


2.10 


2.88 


3.92 


19 


1.73 


2.09 


2.86 


3.88 


20 


1.73 


2.09 


2.85 


3.85 


25 


1.71 


2.06 


2.79 


3.73 


30 


1.70 


2.04 


2.75 


3.65 


50 


1.68 


2.01 


2.68 


3.50 


100 


1.66 


1.98 


2.63 


3.39 




Anhang D 

Symbolverzeichnis 



A 


Aktionenraum 


5.1.1 


AC\B 


A und B, Durchschnittsmenge 


2.1 


AUB 


A oder 5, Vereinigungsmenge 


2.1 


Ä 


Komplement von A 


2.1 


Ai 


Merkmalsausprägung eines qualitativen Merkmals 


1.3.1 


a, b 


Regressionskoeffizienten 


1.4.3 


a* 


Optimale Aktion 


5.3 


B 


Bestimmtheitsmaß (-koeffizient) 


1.4.3 


BV(n, ir) 


Binomialverteilung 


2.5 


bi 


Anzahl der beobachteten Werte in Ij 


3.11 


D 


Entscheidungsraum 


5.2 


d 


Durchschnittliche absolute Abweichung 


1.3.3 


di 


(Letzt-)Entscheidungen 


5.2 


Eil> 


A-posteriori-Erwartungswert 


5.3 


EV( X) 


Exponentialverteilung 


2.11 


e 


Absolute Abweichung bei Intervallschätzungen 


3.5.1 


e j 


Anzahl der erwarteten Werte in Ij 


3.11 


F(x) 


Verteilungsfunktion von X 


1.3. 1,2.2 


F(x,y) 


Gemeinsame Verteilungsfunktion 


1.4.1, 2.3 


FV(V U V2) 


F-Verteilung 


2.12 


Fi 


(Gemeinsamer) Faktor 


1.5.1 


m 


Wahrscheinlichkeitsfunktion einer diskreten, bzw. 






Dichtefunktion einer stetigen Zufallsvariablen 


2.2 


U 


Dichte 


1.3.2 


G — G$ 


Schätzfunktion, Schätzer für d 


3.3 


HV(n, N, M) 


Hypergeometrische Verteilung 


2.7 


Ho 


Nullhypothese 


3.7 


H x 


Alternativhypothese 


3.7 


KxAVi) 


Bedingte relative Häufigkeiten 


1.4.1 


F 


Relative Häufigkeit der Ausprägung A t , Xi bzw. 7, 


1.3.1 
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hl 




Kommunalität 


1.5.1 


hij 




Gemeinsame relative Häufigkeiten 


1.4.1 


I< 




Kontingenzkoeffizient 


1.4.1 


I< m 




Normierter Kontingenzkoeffizient 


1.4.1 


L 




Schadensfunktion 


5.2 


LF{d) 




Likelihoodfunktion 


3.3 


MV(n, 7Ti , . . 


• • » 7r .*) 


Multinomialverteilung 


2.9 


Mi 




Maximal erreichbarer Nutzen bei Aktion a, 


5.4 


m, 




Minimal erreichbarer Nutzen bei Aktion a, 


5.4 


N 




Anzahl der Elemente einer endlichen Grundgesamtheit 1.2 


NBV(k,x) 




Negative Binomialverteilung 


2.6 


NV(fi,(x) 




Normalverteilung, Gauß-Verteilung 


2.10 


NV(fi X ,HY, 


Zweidimensionale Normalverteilung 


2.13 


n 




Stichprobenumfang 


1.2, 3.1 






Anzahl der statistischen Einheiten in Urliste 


1.3.1 


n/N 




Auswahlsatz 


3.1 


TU 




Absolute Häufigkeit der Ausprägung Ai,x, bzw.7, 


1.3.1 






Absolute Häufigkeiten der Randverteilungen 


1.4.1 


riij 




Gemeinsame absolute Häufigkeiten 


1.4.1 


hij 




Absolute Häufigkeiten bei Unabhängigkeit 


1.4.1 


0» 




Opportunitätskosten 


5.4 


p 




Anteilswert (Zufallsvariable) 


2.14.1 
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